Après Touche pas à mon pote, Touche pas à ma voix, par Scarlett Johansson

Publié le 21 mai 2024 à 16:30 par Magazine En-Contact

La célèbre artiste américaine Scarlett Johansson s’est irritée qu’OpenAI ait, selon elle, reproduit sa voix pour construire Sky, une des nouvelles personnifications vocales de ChatGPT.

Le sujet du voice morphing et du voiceprint prend de plus en plus d’ampleur avec les derniers développements de l’intelligence artificielle. Après, les imitations de Joe Biden pour décourager les électeurs américains de voter et les mises en scène téléphoniques employant la voix paniquée d’un proche pour soutirer de l’argent, Scarlett Johansson, la célèbre actrice américaine, est à son tour victime de cette technologie émergente.

Litige autour de l’imitation de la voix de Scarlett Johansson :
Suite à l’annonce de GPT4-o et de ses fonctionnalités vocales, Scarlett Johansson a annoncé qu’OpenAI avait sciemment copié sa voix pour l’une des personnalités vocales de ChatGPT, dénommée Sky. Du côté d’OpenAI, c’est un démenti ferme, mais Sky a tout de même été suspendue, « par respect » selon son CEO Sam Altman. La tentative infructueuse d’engager Scarlett Johansson quelques mois plus tôt pour prêter sa voix à Sky ne plaide toutefois pas en faveur des créateurs de ChatGPT. D’autant que Sam Altman tweetait il y a quelques jours un simple « Her », en référence explicite au film éponyme où Scarlett Johansson double la voix d’une intelligence artificielle qui devient consciente. L’actrice, dans un communiqué s’en dit choquée et s’interroge sur les mesures législatives encadrant ce genre de cas.

Le communiqué en question :
« En septembre dernier, j’ai reçu une offre de Sam Altman qui voulait m’embaucher pour doubler l’actuel ChatGPT 4.0. Je pouvais faire le pont entre la Tech et les créatifs, et ainsi aider les consommateurs à se sentir plus confortable avec les changements drastiques qu’implique l’IA. Sam Altman disait penser que ma voix serait rassurante pour le public.

Après réflexion et pour des raisons personnelles, j’ai décliné l’offre. Neuf mois plus tard, mes amis, ma famille et le public ont tous remarqué comme le nouveau système nommé « Sky » avait une voix similaire à la mienne.

Quand j’ai entendu la démo, j’ai été choquée, en colère et dans l’incompréhension face au fait que M. Altman a choisi une voix si similaire à la mienne que mes proches et les médias ne pouvaient faire la différence. M. Altman a même insinué que la similarité était intentionnelle, tweetant un simple mot « her » - une référence au film dans lequel j’ai doublé un système de conversation, Samantha, qui forme une relation intime avec un humain.

Deux jours avant que la démo de ChatGPT 4.0 sorte, M. Altman a contacté mon agent, me demandant de reconsidérer son offre. Avant que nous puissions répondre, le système était déjà sorti.

En réaction, j’ai été forcé de faire appel à un conseiller juridique, qui a écrit deux lettres à M. Altman et OpenAI, détaillant les faits et demandant le processus exact employé pour créer la voix de « Sky ». Par la suite, OpenAI a accepté avec réticence de retirer la voix de « Sky ».

Dans cette période où nous nous confrontons aux deepfakes, la protection de notre identité, de notre travail, je pense que ces questions méritent une clarté absolue. J’attends une résolution de ce conflit dans la plus grande transparence et le passage d’une législation appropriée pour s’assurer que les droits individuels soient protégés.

Joaquin Phoenix et la voix de Scarlett Johansson dans le film *Her* de Spike Jonze (2013)

Pour vous faire votre propre opinion, voici une vidéo comparant Scarlett Johansson dans Her et Sky, une des voix de GPT4-o.

L'authentification d'une personne par sa voix, une question ancienne :
Juges, policiers, avocats de traders impliqués dans de la fraude (Kerviel) cherchent depuis longtemps à savoir qui se cache derrière une voix, à l’authentifier, à prouver qu’une conversation n’a pas été altérée. La recevabilité comme preuve d’un vieil enregistrement vocal de Jérôme Cahuzac était par exemple au cœur du débat lors de son procès pour blanchiment de fraude fiscale en 2013. Y a-t-il une empreinte vocale, un voiceprint ? C’était déjà la question posée il y a vingt ans par des chercheurs français et britanniques. La suite demain.

Entretien de Nathalie Henrich Bernardony, CNRS, la Baule. La voix est un cadeau de la vie