Le magazine indépendant et international du BPO, du CRM et de l'expérience client.

6,9 euros de l’heure et RLHF. Comment ServiceNow, Hugging Face, Open AI ou le Crédit Agricole entrainent leur IA et leurs callbots

Publié le 28 octobre 2023 à 04:35 par Magazine En-Contact
6,9 euros de l’heure et RLHF. Comment ServiceNow, Hugging Face, Open AI ou le Crédit Agricole entrainent leur IA et leurs callbots

Toloka. ai, Foule Factory (devenue Wirk.io), Remotasks, Onepilot, de nombreuses plateformes permettent d'enrôler et de superviser le travail de taskers, agents de services clients, qui améliorent les IA, les chatbots, le service client.Pourquoi, comment, à quel tarif, avec quelle rémunération ? Le RLHF (reinforcement learning from human feedback) qui a été notamment utilisé par ChatGPT, est une technique d'apprentissage automatique par renforcement à partir de rétroactions humaines. Il est considéré comme un palier nouveau. 7,3 dollars de l'heure, tel est le tarif auquel cette “rétroaction humaine” est achetée par ServiceNow. L'efficacité de ces pratiques a été expliquée par Sean Hughes, AI Ecosystem Director chez ServiceNow. Mais Emma, utilisatrice de ServiceNow ne semble pas aussi convaincue. 

Le contexte, les enjeux.

De nombreux invisibles, travailleurs du clic, petites mains travaillent en coulisses pour que les robots conversationnels fonctionnent avec efficacité, que le RLHF (reinforcement learning from human feedback ) rende les algorithmes plus performants. Car l’IA a besoin d’être entrainée. ServiceNow et Hugging Face, par exemple, ainsi que d’autres acteurs de l’IA ou du cloud rémunèrent ces petites mains environ 7 dollars de l’heure. Ce tarif de prestation aurait été calculé par les commanditaires pour être équivalent -procurer le même pouvoir d'achat- au salaire minimum le plus élevé aux Etats-Unis : 16,5 dollars/heure. 

Wirk.io, ex Foule Factory, Onepilot, Alcméon, quelques acteurs français.

En France, Wirk.io a abandonné ce premier métier, qu'il pratiquait sous l'enseigne Foule Factory, pour créer désormais une plateforme de supervision et d'amélioration de la productivité des tâches et missions externalisées. Onepilot, qui connait une forte croissance, s'est spécialisée dans le service client assuré par des agents indépendants, opérant en télétravail. Ses clients, dont SNCF Connect, en sont satisfaits, comme ils en ont témoigné récemment à ECTFF.  Alcméon permet de son côté au Monde ou à Fnac-Darty de superviser la modération de commentaires ou avis clients, confiée à des collaborateurs localisés par exemple à Madagascar.

Bill McDermott, CEO de ServiceNow

Taking care of the crowd. France5 rediffusait mi-avril un documentaire d’Henri Poulain, une incursion dans les coulisses des services numériques que nous utilisons au quotidien, non sans nonchalance. Siri écoute-t-il nos conversations ? Qui sont les modérateurs qui rendent moins pénible notre lecture des commentaires au bas d’un article ou sur Facebook ?  Les Invisibles, les travailleurs du clic nous emmenait, de Dublin à Madagascar en passant par Lyon, à la rencontre de ces rouages anonymes d’une machine tentaculaire et mondialisée qui se prénomment Zlat, Bilel, Nomena, Marolafy, Chris, Thomas. Livreurs, modérateurs, lanceurs d’alerte, il existe un indispensable capital humain derrière la révolution numérique.

Zlat et Bilel à Lyon : des livreurs UberEats qui font 60 heures par semaine pour 400 euros – ce qui ferait un peu moins de 1500 euros une fois ôtés les 20% réclamés par l’URSSAF. Un matériel à charge de l'autoentrepreneur, pareil pour la couverture sociale, une rémunération à la course pleine d’incertitude. On commence à connaître le fonctionnement de l’application. 

Nathalie, dans un endroit imprécisé de France, compare, pour améliorer la recherche Google, des mots clés entre eux en vérifiant qu’ils ont le même objet. Exemple : « la moutarde dijon » et « moutarde de dijon ». Elle valide. Ses explications sont données avec un ton défait, qui excède la simple lassitude.

A Madagascar, Nomena et Marolafy. Nomena gère sur Facebook et Twitter des « tâches » pour Disneyland via la plateforme Alcméon. Elle est en fait employée par Netino, une filière de Webhelp – à qui Le Monde, entre autres, sous-traite aussi la modération de ses commentaires – , et gagne 200 euros pour 48h par semaine. Et il y a Marolafy qui, après une licence en business administration en Chine, s’occupe de retranscriptions audio et autres tâches du même acabit pour le compte d’Isahit. La « plateforme éthique de labellisation des données pour l'IA et le traitement des données », comme elle se définit, avait pour habitude de tendre le micro sur son compte Facebook à ses « hiteuses », comme elle nomme ses employées, sur Facebook afin de recruter. Ce n’est plus trop le cas depuis un an au moins. Dans ces campagnes de recrutement par Isahit, les tâches sont présentées comme un moyen compléter un éventuel revenu ou de se maintenir à flot financièrement entre deux emplois. 

Le site de Toloka.ai

A Dublin, Chris Gray modère des contenus pour Facebook, bien que son contrat ne l’indique pas explicitement. La violence des contenus déversés à longueur de journée sur le réseau, et dont il avait la charge, a fini par l’ébranler. A Cork, non loin de là, Thomas Le Bonniec s’est lui-aussi glissé dans le costume de lanceur d’alertes, après avoir auditionné des heures et des heures de conversation transmises par Siri, l’assistant intelligent d’Apple. « Siri n’est pas une intelligence artificielle », dit-il «tout le travail d’amélioration ou de machine learning est fait par des humains ». Une affirmation sans doute exagérée qu’il nuance cependant aussitôt : « tout le travail d’intelligence artificielle, ce sont des gens qui nourrissent la machine. » Le constat principal du documentaire, qui relève aujourd’hui du lieu commun auquel on ne voudrait pas trop penser, est là : à chaque instant nous produisons des données qui viennent gratuitement alimenter la machine. Il y a sans doute quelques beaux sujets pour un bac philo ici. En attendant, le documentaire opère le rappel salutaire que ce que nous croyons être intégralement ou majoritairement automatisé cache un véritable travail humain. En forme de note d’espoir, il montre pour finir une tentative d’organisation syndicale des livreurs UberEats. Pour des résultats qui tardent à venir (les contrats actuels sont par ailleurs moins avantageux qu’il y a trois ans). Ou Mensakas, un service de livraison à domicile barcelonais sur un modèle coopératif non lucratif. 

Open AI aurait consacré des dizaines de millions de dollars pour entrainer ChatGPT au RLHF.

ServiceNow et Hugging Face “embauchent” sur Toloka.ai des free-lance pour améliorer la performance de BigCode, une IA en open source. Le projet, considéré comme très réussi et performant, a permis de tester ce Code-generating LLM. Dans une vidéo et un testimonial que la plateforme Toloka.ai utilise désormais comme argument commercial, les deux pilotes du projet, Loubna Ben Allal (Hugging Face) et Sean Hughes (ServiceNow), expliquent qu'ils sont conjointement parvenus à entrainer et améliorer BigCode Project, en quatre jours seulement; grâce à 1399 Tolokers qui ont réalisé ensemble 4349 heures de supervision et d'entrainement de l'IA. Cet entrainement des algorithmes, des modèles de LLM par des humains, n'est pas foncièrement nouveau mais il serait efficace.. et coûteux. Des plateformes telles que celles évoquées permettent la réalisation du projet pour des sommes moindres et des délais raccourcis.

ServiceNow, en France. Il ne semble pas possible d'évoquer ces questions et pratiques avec ServiceNow, en France. Jointe par nos soins à plusieurs reprises, l'entreprise (dont la filiale est dirigée par Rémi Trento) se présente comme "une plateforme cloud qui simplifie la façon de travailler, améliore la résilience, les processus d'expérience client” n'a pas souhaité que nous échangions avec ses dirigeants. On peut retrouver ses encarts publicitaires dans les Echos. Sur le sujet évoqué, il faut donc s'en tenir:

  • soit à ce résumé, qu'on trouve dans un post sponsorisé: “The Starcoder model surpassed every open Code LLM that supports multiple programming languages and competes with (..) Achieving these results without Human-in-the-Loop would be challenging. Crowdsourcing is an effective approach, delivering quality labeling in a limited time frame across a range of complexity”.
  • soit à l'avis d'Emma, utilisatrice. Sur Google My Business, cette salariée travaillant dans une entreprise équipée de ServiceNow partage son point de vue, un peu dissonant: "Je déteste cette application mise en place dans notre entreprise anglo-saxonne. Un vrai désastre. On ne s'y retrouve jamais. On a tellement de dysfonctionnements, en informatique et en compta (..) et en plus, on reçoit des mails pour noter nos correspondants (..) Aucun temps gagné, que des emmerdes”.

Au printemps cette année, Carrefour annonçait en grande pompe le lancement de son chatbot dopé à l'IA générative. Hopla, 1er outil de ce type lancé en France par un retailer, ne nous avait pas foncièrement convaincus, malgré le budget que le groupe y aurait consacré (2 millions d'euros) et le soutien de Bain&Company et Microsoft. Lire ici.

Pour aller plus loin: le numéro 130 d'En-Contact consacrera un large reportage aux équipes de modérateurs qui travaillent, en Colombie, à Malte ou sur le continent africain, chez les plus grands spécialistes* mondiaux, dont Teleperformance. Convaincue que la santé mentale des modérateurs pouvait être conciliée avec leur métier complexe, le numéro 1 mondial du BPO a créé à Bogota, Medellin, des centres particulièrement innovants et performants. Il n'y a donc peut-être pas de fatalité à externaliser certaines tâches, très loin, à concilier performance économique et collaborateurs heureux de leur travail et mission.

*Accenture, Besedo, Webhelp, etc.  

Benoit Hocquet et Manuel Jacquinet. 

Ici le reportage sur les modérateurs.

A lire aussi

Profitez d'un accès illimité au magazine En-contact pour moins de 3 € par semaine.
Abonnez-vous maintenant
×