Conversion de la conversation (Speech to text)
Speech to text et Quality Monitoring : ils pourraient devenir demain les CATIA du secteur.
Choisies et plébiscitées par des partenaires exigeants, deux entreprises françaises n’ont pas attendu que le Gartner s’intéresse à elles pour croitre -et déloger parfois, chez de grands acteurs, des éditeurs renommés et richement dotés et spécialisés dans la retranscription vocale ou le Speech Analytics. A l’instar de l’outil de CAO créé en 1977 par Dassault Aviation pour ses propres besoins, et qui est devenu numéro 1 mondial de son marché, DeepTranscript, Cross-CRM et Callity combinent discrétion de leurs fondateurs et focalisation rigoureuse sur la valeur perçue. Pour être retenu ou choisi en face de Nice, Verint ou Hubicus, il faut… délivrer !
Qui et comment monitorer 5 milliards de conversations par an ?
La voix, qu’on disait moribonde, s’installe ou perdure comme un canal de dialogue plébiscité. Pour joindre un prospect, un client, pour résoudre une installation de Box Internet, pour annuler une réservation ou en connaitre les modalités, la planète entière téléphone. Les entreprises et institutions sont donc amenées à tenter d’automatiser parmi ces conversations, les plus fréquentes et à faible valeur ajoutée et de concevoir donc des callbots et à tenter de tirer profit d’une bonne analyse des conversations qu’elles initient et conduisent avec leurs clients ou usagers. Le speech-to-text permet de photographier ce qui a été dit, le speech analytics d’en tirer la substantifique moelle. Faire que ceci fonctionne en langue française est un trou de souris pour les anglo-saxons (pas prioritaire, occupons-nous de la langue anglaise) dans lequel Jonathan Tunnicliffe et Nicolas Panel se sont engouffrés. Savoir et se rappeler par exemple que le seul Teleperformance engage et mène plus de 5 milliards de conversations par an donne une juste idée de l’enjeu et du marché.
« J’ai consacré 3 ans à développer un moteur de transcription fiable »
Nicolas Panel. Lui et son associé, Yann Bermond, tous deux ingénieurs Arts et Métiers, ont fondé Callity, qui édite également Deeptranscript.
En-Contact : Que permet de faire votre outil Deeptranscript et pourquoi des entreprises s'intéressent-elles à l'indexation de conversations ?
Nicolas Panel : Il faut avoir en tête que notre capacité naturelle à interpréter des idées et des sentiments exprimés par la voix, pour les restituer de manière synthétique et cohérente, est une tâche complexe particulièrement difficile à robotiser. Cela peut sembler contre intuitif au premier abord, car chacun d’entre nous le fait sans effort au quotidien et le plus souvent inconsciemment, mais imaginez que vous deviez retranscrire par vous-même une conversation qui se déroule dans une langue qui vous est inconnue, ça pourrait prendre un peu de temps…C'est principalement cette complexité qui fait que l’indexation de conversations est encore aujourd’hui presque exclusivement faite par des humains. Ce que nous proposons avec Deeptranscript est un ensemble de briques techniques capables de gérer cette complexité pour retranscrire fidèlement et annoter automatiquement des conversations comme pourrait le faire un humain, mais beaucoup plus rapidement et à grande échelle.
Ça peut donc servir également à vérifier la conformité de certaines opérations, engagements pris par téléphone ?
Tout à fait, et les cas d’application sont très variés : bien sûr vous pouvez l’utiliser pour vérifier que quelque chose a bien été dit, ou encore la façon dont cela a été dit, mais Deeptranscript permet d’aller beaucoup plus loin. Transformer les données issues des conversations clients en information structurée et exploitable ouvre des opportunités à tous les niveaux de l’organisation : on peut améliorer l’efficacité opérationnelle des agents et de leurs managers, permettre et faciliter la prise de décisions stratégiques pour la vente, le marketing, le produit ou bien encore la fidélisation client.
Un deuxième outil que vous avez développé est reconnu comme une solution de Quality Monitoring particulièrement adaptée. Qu'est-ce que le QM pour un néophyte et pourquoi les centres d'appels en font-ils un large usage ?
Capter et structurer la donnée est une chose, l’exploiter dans un contexte métier particulier en est une autre. Quand on parle de Quality Monitoring, l’enjeu principal est l’amélioration continue du discours des agents. En d’autres termes : comment accélérer les phases d’on-boarding et aider la progression dans le temps, grâce à des guidelines clairs et des feedbacks réguliers ? C’est le plus souvent le périmètre des équipes formation et qualité, que l’on accompagne via notre offre Callity - service SaaS très facile d’utilisation - qui leur permet de se concentrer sur des tâches à forte valeur ajoutée et à fort impact.
De grandes marques, et des centres de Relation Client, ont adopté ou adoptent aujourd'hui Callity, pourquoi ?
La première raison, selon moi, est un début de prise de conscience du marché sur la nécessité et la faisabilité d’exploiter pleinement les conversations clients. Pour l’amélioration des processus internes, bien sûr, mais aussi et surtout pour donner aux dirigeants les informations dont ils ont besoin pour prendre les bonnes décisions et choisir les meilleurs plans d’actions que ce soit pour développer le chiffre d'affaires, l’engagement client ou la fidélisation des équipes. Ensuite il y a notre savoir-faire technologique, très supérieur à ce qui peut se faire par ailleurs en langue française, et qui nous donne une grande agilité pour nous adapter aux enjeux de nos clients et être particulièrement réactifs.
J'ai entendu une objection intéressante et qui dit tout de la difficulté à installer, promouvoir et faire adopter des logiciels ou solutions concurrents de ceux proposés par des grandes entreprises : que peuvent-ils avoir conçu, développé alors qu'ils se battent contre des sociétés très installées, avec des centaines d'ingénieurs ?
Je ne pense pas que les sociétés très installées, avec des centaines d'ingénieurs, soient plus à même d’innover sur des sujets technologiques comme le nôtre. Pour trouver des solutions nouvelles sur des sujets complexes, dans le monde du logiciel informatique en tout cas, la motivation et la façon de poser le problème compte parfois beaucoup plus que les moyens mis en œuvre. Quand nous avons lancé l’aventure il y a trois ans, le fait de disposer d’un moteur de transcription fiable et scalable était un prérequis indispensable pour la suite et sans quoi rien d’autre ne serait possible. C’est probablement ce qui nous a donné l'énergie nécessaire pour aller chercher ce que les autres n’avaient pas encore trouvé.
« Le sentiment négatif peut évoluer au cours d’un appel. »
Le partenariat entre la Ratp et Cross CRM.
Comme quantité d’autres entreprises, la RATP dispose de son service client, localisé à Paris dans le 12ème arrondissement. Une centaine d’agents s’y emploie à répondre aux contestations de PV, aux demandes d’information sur les itinéraires. Depuis le 1er décembre de cette année, l’équipe en charge a décidé de migrer d’Hubicus vers Cross CRM, la plateforme de Quality Monitoring et de Speech Analytics dont les résultats l’ont bluffé durant le test qui a été réalisé : « On parvient à déceler la couleur d’un appel, la tonalité du sentiment qui caractérise une conversation et ce dernier peut évoluer, même lorsque l’appel concerne la contestation d’une amende », précise Xavier Bouillevart, responsable qualité et formation qui a piloté le changement de prestataire pour cet outil.
« Nous étions préalablement équipés de la solution Hubicus, avec laquelle nous réalisions notamment des enquêtes de satisfaction, un module qu’ils allaient cesser de maintenir et de commercialiser. Cross CRM, que connaissait un peu Gaétan Bultez (le responsable du service client) a été testé lors d’un POC. Nous avons eu l’occasion d’apprécier la richesse et la simplicité de l’outil, qui permet de réaliser les 3 choses essentielles dans la supervision de la qualité des conversations : on peut échantillonner les appels qui vont servir à pratiquer du quality monitoring, y associer nos grilles d’écoute sans difficultés ; enfin, leur module de Speech Analytics est très performant, et autorise la visualisation de la tonalité des appels. On constate ainsi de façon éloquente l’impact du travail d’un collaborateur. Les voyageurs appellent rarement pour parler de la pluie et du beau temps, mais pour demander des informations sur le fonctionnement d’une ligne, suite à des grèves ou pour contester des PV. Tout d’abord tendu, l’échange peut évoluer vers une tonalité apaisée, parce que la personne a compris, qu’on lui a expliqué. C’est tout l’enjeu et parallèlement, ce retour auprès des agents est du coup très positif et valorisant. »
Le parcours de Jonathan Tunnicliffe, fondateur de l’outil, explique en partie la philosophie qui a présidé à la conception de Cross CRM : son passé chez un éditeur de logiciels pour centres d’appels lui a fait découvrir la pertinence de créer des outils fiables, simples à mettre en œuvre et dont les opérationnels doivent s’emparer. « Il faut donc prendre le meilleur de la technologie là où elle se trouve et interconnecter tout ce qui peut l’être avec les plateformes utilisées dans les centres de contacts. Les briques technologiques de speech-to-text avec lesquelles nous travaillons sont issues et sélectionnées parmi toutes celles du marché, je suis agnostique sur ce point. La Data Visualisation permet de donner vite des indicateurs et de les rendre disponibles et éloquents, et nos outils (Listener, Survey, Speech Analytics) se pluggent sur toutes les solutions du marché. Que vous soyez équipé d’Avaya, de Vocalcom, utilisez iAdvize, notre plateforme peut être déployée rapidement. Dernier point et non des moindres, le support est joignable, bien dimensionné et assuré par des profils seniors, qui connaissent bien la réalité des call center. »
La visite de l’appartement témoin ne serait pas complète sans un focus sur le module de Speech Analytics, fondé lui aussi sur une analyse des méta données qui peuvent être puisées et analysées dans tous les verbatims qui arrivent au service client : tout ce qui est exprimé et remonte au service client, via les e-mails, les appels, les reseaux sociaux, les chats, les courriers - est analysé mais cette fois, contrairement a la stasi, a des fins d'améliorer la vie de tous ;) La voix du client, si on l’entend et la comprend vite, permet aux entreprises de réagir, de changer de cap parfois, de former ses agents. Après avoir consacré de longues années à développer ses connecteurs chéris, qui interfacent son outil avec l’écosystème, le jeune papa passe à l’attaque.
La Stasi, le BEA, quand des enquêtes aux enjeux stratégiques se fondent sur la retranscription des conversations ou le speech analytics.
Le cinéma, bon reflet de la société, de ses tourments et des outils qu’on utilise ou a utilisé dans des histoires vraies ou romancées, figure et met en scène depuis une quinzaine d’années et de plus en plus des enquêteurs qui s’emparent d’outils similaires à ceux évoqués dans ce dossier.
• Dans Mécanique de l’ombre (de Thomas Kruithof), Duval (François Cluzet) est embauché de façon discrète pour retranscrire chaque jour, dans un appartement vide, des conversations et écoutes secrètes.
• Dans La vie des autres (de Florian Henckel von Donnersmarck), Gerd Wiesler, capitaine de la Stasi, a besoin d’un imposant matériel d’écoute pour surveiller un auteur de théâtre et sa compagne, dont les écrits et pièces dérangent le régime en place.
• Dans Boite Noire (de Yann Gozlan), Mathieu Vasseur (Pierre Niney) est un enquêteur du BEA qui enquête sur une catastrophe aérienne. L’issue de l’enquête et la vérité sont peut-être au cœur du CVR (cockpit voice recorder) l’une des boites noires, celle qui sert à enregistrer les échanges qui se sont tenus dans le cockpit. L’authenticité de ceux-ci, le fait qu’ils n’aient pas été altérés ou modifiés va obséder le jeune enquêteur.
Par la rédaction d'En-Contact
Photo de Une : Boite Noire - © Thibault Grabherr