"Prends ta voix de blanc", de Alta Voce à Sanas ou Zaion, ces sociétés qui transforment la voix des agents des call-centers.
Prends ta voix de blanc, disait en rigolant, en ne rigolant qu'à moitié en fait, Danny Glover à l'un de ses collègues* au sein de sa société de télémarketing, dans le film Sorry to Bother you, Ovni cinématographique sorti en 2018 et réalisé par Boots Riley. Il ne s'agissait pas de science fiction : 3 ex- étudiants de Stanford ont levé, en Juin de cette année, plus de 32 millions de dollars pour leur compagnie, Sanas.ai, auprès de fonds renommés, pour tenter de concrétiser une promesse : réduire les effets pervers de son accent étranger quand on travaille dans les centres d'appels.. Il faut en effet savoir, se rappeler que: le sourire au téléphone s’entend et influence massivement l’issue des conversations menées dans les call-centers. Que mener une conversation avec un accent étranger s'avère un handicap pour des millions d'agents de centres d'appels et BPO. Si vous ne l'avez pas encore vu, méditez déjà le texte de cette scène mythique du film, qui en dit plus sur le secteur du BPO et les 1001 astuces efficaces que les Sales Men ont été amenés à imaginer, pour leur cold calls : Use your white voice. You wanna make some money here ? …Read the script with a white voice. Talk white enough..I'm not talking about the Will Smith voice but something like this. ( une simulation de début d'entretien suit )
Focus sur quelques innovations, travaux ou levées de fonds récentes dans les domaines hyper stratégiques du Speech Analytics, du Voice Altering Tech, du NLP ( Natural Language Processing). Sur le marché mondial du BPO où quelques acteurs plus innovants que d'autres, tels Alorica, Sitel, Vipp-Interstis, Webhelp testent plus vite que leur compétiteurs ces nouvelles ruptures technologiques.
Ce qui s'est passé d'essentiel ces derniers mois :
Alta-Voce (voir l'interview des fondateurs ci-dessus) est en plein pivot et à la recherche d'un partenaire financier pour poursuivre son expansion. Une banque d'affaires a été missionnée en ce sens.
Callity, spécialiste du Quality monitoring et de la retranscription des conversations dans les centres de contacts a séduit de nombreux BPO et étonne par les performances de sa solution, adoptée par exemple par Marketshot. Les esprits chagrins qui se demandaient comment deux ingénieurs des Arts et Métiers pouvaient faire aussi efficace que les équipes de Google risquent.. de manger leur chapeau.
Uh.live (Allo-Media) a changé de modèle et fait déployer sa solution (son API de traitement des conversations vocales) dans ce domaine par des intégrateurs tels OBS, Odigo, Worldline; notamment chez EDF, qui en serait très satisfait. Lisez l'interview à de Romain Sambarino, son fondateur, dans le numéro de Septembre d'En-Contact.
Dans les différents SAMU en France, on n'en est pas encore à transformer son accent mais à tenter de recruter et former des Assistants de régulation, ces spécialistes du traitement et de l'analyse des premiers appels. Ils en manquerait plus de 20% des effectifs globaux nécessaires, bien que le chiffre soit contesté notamment par les services de François Braun, Ministre en charge du sujet. La faible rémunération proposée et la reconnaissance minimale accordée aux titulaires des postes seraient en cause ( les assistants de régulation sont considérés comme de simples agents d'administration publique). L'analyse de ce qui se dit dans les appels liés à la santé est pourtant au coeur d'investissements majeurs, de la part d'Amazon ou d'autres, tels Microsoft ( cf le montant du rachat de Nuance )
Sanas.ai a levé 32 millions de dollars aux USA, serait en phase de développement de sa solution de transcription et de transformation des accents, principalement sur le marché anglophone. Alorica, l'un des grands acteurs mondiaux du BPO, serait l'un des premiers partenaires et testeurs des solutions techniques proposées par la société dont le CEO est Maxim Serebryakov et le CTO Shawn Zhang, tous deux issus de Stanford. C'est le récit des difficultés de l'un de leurs copains qui a financé ses études en travaillant dans un call-center et se faisait rabrouer à cause de son accent, qui leur aurait donné l'idée de créer “a Voice Altering Tech, in order to erase call-center accent”. Mais la “Real Time Transcription with no latency of text-to-speech” ferait également partie de l'offre.
Zaion, qu'on ne présente plus, et reconnue pour la qualité et la performance de ses callbots, ajoute de nouvelles fonctionnalités à son portfolio de solutions sur le NLP. Les ambitions, grandes, et le track-record de l'entreprise créée par Franz Fodéré devraient permettre de belles annonces dans le domaine de l'IA, dans les prochains mois.
Hipto, spécialiste de la fourniture de leads qualifiés pour la télévente, a décidé de soutenir et devenir co-organisateur de la CFT, la 1ère coupe francophone de télévente, que va organiser en 2023, notre magazine. Parce que le talent des télévendeurs, qui ne se réduit pas à opter pour un autre accent que celui qu'on peut avoir, est vaste, incroyable parfois et peut aller jusqu'à consacrer du temps pour se préparer ou fournir des bons fichiers de prospects à contacter. Cold calls are dead :)
Une grande partie de ces fournisseurs et de leurs clients se retrouveront à la Baule, fin Septembre pour la 10ème édition d'ECTFF, le forum de l'expérience client. Charles-Emmanuel Berc, qui a, en Afrique sub-saharienne, eu la gentillesse de tester pour nous, en situation réelle, une grande partie de ces technologies, nous y partagera son point de vue: sur l'importance de gommer ou pas les accents; sur les bénéfices d'un programme de formation innovant dédié à la création de la connivence relationnelle. Sur les bénéfices de participer à la tournée d'un président de la République au Cameroun. C'est à lire ici.
Pour aller plus loin : Alta Call, la solution d'Alta Voce.
Fondée par une équipe internationale d’ex-chercheurs des laboratoires parisiens du CNRS et de l’Ircam, une entreprise française pourrait bien révolutionner l’industrie mondiale de la relation client et celle de la communication à distance. Les premiers tests menés en situation réelle sur les plateformes téléphoniques permettent de développer le nombre de ventes conclues et la satisfaction ressentie par les clients.
Le sourire s’entend. La première bonne nouvelle est qu’il se fabrique en partie.
On avait, à la rédaction d’En-Contact, identifié en 2017 lors des journées de l’Ircam, une équipe de chercheurs dont les travaux de recherche nous avaient particulièrement impressionné. À l’époque Marco Liuni et Gilles Degottex travaillaient dans cette équipe, dirigée par Jean-Julien Aucouturier, et avaient présenté des études qui démontraient expérimentalement que la façon dont on débute une conversation menée à distance, dont on dit Bonjour par exemple, et ce dans plusieurs langues, influait sur l’issue de la conversation. Mais ils avaient également présenté deux applications qui permettaient de transformer ou modifier des éléments de la prosodie dénommée. Et celles-ci étaient fonctionnelles. Et les chercheurs en question les avaient conçues et développées dans des langages de programmation qui permettaient leur utilisation par des tiers. Pour nous, c’était sûr, l’industrie des centres d’appels et toutes les entreprises dont la relation client s’exerce à distance allaient très vite convenir d’un rendez-vous avec l’équipe de l’Ircam (Marco, Gilles, Jean-Julien ).
Mais l’Ircam et ses chercheurs n’ont pas d’influenceurs, Cyril Hanouna ne s’intéresse pas aux centres d’appels et les équipes du Samu, même confrontées à des décès provoqués par des conversations menées hors des protocoles (comme dans le cas de Naomi Musenga) n’embarquent pas toujours avec célérité les solutions techniques ou réelles innovations, celles qui permettraient une révolution dans la prise en charge des appels. A quelques semaines d’une levée de fonds qui passionne le petit monde des sachants en matière de NLP, de Voice Recognition, de Noise Cancelling, En-Contact est allé rencontrer le quatuor* hébergé boulevard Raspail et l’un des industriels de l’expérience client externalisée qui a testé Alta Call.
En-Contact : Marco Liuni, que permet de faire Alta Call, le premier service développé par Alta Voce ?
Marco Liuni : depuis deux ans Alta Voce a développé et mis sur le marché des technologies vocales pour améliorer toute conversation à distance. Alors que les solutions existantes permettent de modifier des caractéristiques physiques difficiles à interpréter (les concepts de fréquence fondamentale ou de spectre n’étant pas forcément accessibles à tout le monde), notre approche se base sur la possibilité de modifier des caractéristiques d’une voix avec une interprétation claire (telles que la chaleur, ou le dynamisme), dont l’impact sur une conversation est connu : notre premier produit, Alta Call, élimine tout bruit ambiant, rend une voix plus intelligible en agissant sur son timbre, et permet de moduler le sourire perçu. Tout cela en temps-réel, sans altérer le flux d’une conversation, au téléphone ou en visioconférence.
Tout un chacun comprend, pressent ou a constaté que le sourire ou des items tels que la tonalité positive d’une conversation influencent la perception qualitative de l’appel et donc probablement son issue. Mais l’équipe au sein de laquelle vous avez travaillé l’a prouvé et a développé l’application qui permet de fabriquer ce sourire, en sus d’éliminer les bruits ambiants, de programmer les correctifs dont il serait bon que chaque voix se pare. Combien de temps et quels travaux ont été menés avant d’' aboutir à ceci ?
ML : Les technologies qui sous-tendent Alta Call sont le résultat de plus de dix ans de recherches en neurosciences cognitives et traitement du signal, menées par l’équipe fondatrice dans les laboratoires parisiens de l’IRCAM et du CNRS, mais aussi dans des universités de renommée mondiale telles que UCLA et Cambridge. Elles ont montré expérimentalement que la voix a le pouvoir de changer le sentiment d’ urgence qu’un médecin perçoit lors d’un appel au SAMU, ou d’améliorer les possibilités d’analyse de l’activité cérébrale chez les patients dans le coma. Et que ces technologies peuvent induire une modification positive de l’humeur, jusqu’à la génération inconsciente d’un sourire contagieux[3] à l’autre bout de la ligne.
EC : Pouvez-vous expliciter ce dernier point ?
ML : Une étude menée dans l’équipe de Jean-Julien a montré que non seulement la modulation appliquée rend une voix plus souriante chez la personne qui l’écoute, mais aussi que le son de cette voix induit une imitation faciale inconsciente du geste même du sourire. Ce résultat, fascinant, est confirmé dans une étude similaire, cette fois ci menée avec une population de personnes aveugles dès la naissance ; l’imitation faciale est bien induite par le son du sourire lui-même.
EC : l’Ircam, Cambridge, Ucla sont-elles des universités ou des centres de R/D réputées pour ces travaux ? Peut-être y a-t-il, sans que je ne le sache, une autre équipe de chercheurs quelque part, qui a travaillé sur ces sujets et a conçu une killer application de morphing de ma voix encore plus efficace.Dit de façon plus cash, une équipe de chercheurs chez les Gafa pourrait-elle aboutir à ces mêmes résultats en peu de temps ?
ML : L’Ircam est un institut à la pointe de la recherche et l’innovation dans toutes les dimensions du son et de la musique, ainsi que de ses applications. L’activité de recherche que Jean-Julien a dirigée depuis son arrivé dans l’institut a ouvert un nouveau paradigme d’investigation : comment la voix et ses caractéristiques génèrent elles des émotions ? Le fait de chercher des réponses quantitatives et objectives, en passant par des méthodes expérimentales reconnues par la communauté des neurosciences, a déterminé l’impact très conséquent de ces résultats dans plusieurs domaines, de la musique à la relation client, jusqu’aux études cliniques en neuro-réanimation. L’Université de Cambridge a l’un des département de parole les plus réputés au monde, alors que le département de communication de UCLA est une référence pour les aspects liés à l’évolution du comportement humain également en relation à la voix. Si cette killer application existe, notre équipe n’en est pas au courant, et ce ne sera pas faute d’avoir cherché :). Quant à un géant tel que Google ou Amazon qui désirerait reproduire une innovation majeure telle que la nôtre, compte tenu des armées qu’ils peuvent déployer en R&D, il leur faudrait probablement deux ou trois ans, mais c’est une estimation très approximative !
Transformer la voix en temps réel.
EC : L’industrie des centres d’appels pourrait considérablement agir sur des indicateurs qui sont au cœur des attentes qu’on place en ses services : développer les ventes et améliorer la tonalité des conversations. Les impacts sont majeurs. Quels résultats se dégagent des premiers POC qui ont été menés en production avec Webhelp, avec des effectifs limités, et dans le premier à échelle industrielle?
ML : Ces technologies sont désormais à la disposition des centres d’appels pour améliorer la performance et les conditions de travail de leurs agents. Si les conversations sont de meilleure qualité, c’est à la fois le client et l’agent qui en bénéficient, rien de sorcier à comprendre cela. Mais ce qui a impressionné nos interlocuteurs et fonde en partie la réelle innovation d’Alta Voce vient de notre technologie temps réel. Celle-ci peut garantir un temps de traitement de moins de 30 millisecondes, ce qui préserve entièrement le flux naturel de la conversation, avec des exigences moindres en termes de puissance de calcul et de bande passante. La qualité du traitement est au standard de l'industrie musicale, et l’identité vocale de la personne parfaitement préservée. Les améliorations sont impressionnantes au dire de nos interlocuteurs : que ce soit en appel entrant ou sortant, pour des indicateurs de vente ou de satisfaction client, les premiers tests avec Alta Call ont fait enregistrer des résultats sans précédents. Dans le premier test mené à échelle industrielle en télévente, Webhelp témoigne d’une amélioration du taux de conversion jusqu’à 30% et jusqu’à +6% du taux de ventes par heure. Dans les deux tests menés en service client, pour l’instant avec des effectifs de 20 agents, le taux de satisfaction client a progressé de 8%.
EC : Soyons très concrets, pour un néophyte. Imaginons que je dirige une agence immobilière ou un centre de téléprospection qui vend des régimes minceur ou bien, soyons imaginatifs, un laboratoire d’analyses médicales au sein duquel ma secrétaire médicale reçoit quantité d’appels pour des prises de rendez-vous, que je ne peux honorer dans le délai espéré par les appelants. Et du coup, ça chouine souvent au téléphone. Que pourrait me proposer Alta Call ?
ML : Aujourd’hui, Alta Call va permettre à vos collaborateurs de se concentrer sur le client : son écoute active et la réponse à apporter. Avec moins d’efforts à produire pour garder le sourire malgré un contexte de conversation difficile, et en garantissant que la voix sera perçue claire et sans bruits au bout du fil. Nous avons probablement tous fait l’expérience d’une première impression positive de la voix de notre interlocuteur, qui désamorce notre propre frustration, et nous fait réaliser que la personne qui nous parle n’en est pas responsable. Notre problème n’est pas résolu pour autant mais nous gardons une image meilleure de notre expérience d’appel, ce qui impacte directement notre fidélité et la relation avec la marque à l’avenir.
EC : Webhelp a été l’un des premiers opérateurs de centres de contacts à tester en mode POC la technologie mais on peut penser que le secteur de la santé aurait un réel bénéfice à mettre en place un outil tel qu’Alta Call. Quels bénéfices pourrait en tirer ce secteur, dans lequel quantité de consultations, d’appels d’urgence sont gérés désormais en mode vocal et à distance ?
ML : Améliorer la compréhension au téléphone en agissant sur la clarté de la voix et l’élimination des bruits apporte du bénéfice dans tous les contextes d’appel. Dans la santé, en particulier lorsqu’il s’agit de personnes âgées ou avec des difficultés de locution, on peut appliquer Alta Call à la fois sur la voix du patient et sur celle du soignant, à fin d’améliorer l’efficacité et la qualité de la prise en charge. En ce qui concerne la modulation des caractéristiques de la voix, chaque contexte demande une voix adaptée, et cette capacité d’adaptation vocale n’est que rarement maîtrisée par quelqu’un qui n’est pas formé. Notre technologie permet d’optimiser de manière flexible la qualité d’une voix afin d’améliorer son efficacité : par exemple, nous préparons un test pour accroître la capacité à convaincre des donneurs de sang potentiels (des campagnes qui sont menées par les établissements EFS)
Le fonctionnement de la solution : Alta Call s’installe en local sur l’ordinateur de l’agent, et est contrôlé à distance via un espace client. L’agent n’a aucune démarche ultérieure pour en garantir le fonctionnement, individuel. Plus de 1 400 postes sont déjà équipés chez des leaders internationaux de la relation client, avec des témoignages encourageants : “Je suis moins fatigué à la fin de la journée”, “Mes conversations sont plus faciles”.
*Nicolas Martinois est le quatrième associé de l’équipe d’Alta Call désormais, depuis la création de l’entreprise.
Alta Voce vous accueille au salon Stratégie Clients - stand F21
Photo de Une - © crédit Edouard Jacquinet