SoftBank (géant japonais de la technologie) annonce travailler sur une solution intéressante alimentée par l'intelligence artificielle, conçue pour offrir un plus grand confort de travail aux personnes travaillant dans le service client.

La technologie a été développée dans le cadre du projet d'entreprise de SoftBank appelé SoftBank Innoventure, en coopération avec l'Institute for AI and Beyond, un institut commun de recherche sur l'IA fondé par l'Université de Tokyo. La technologie de modification vocale en temps réel vise à réduire le stress des employés des centres d’appels. La solution changera la voix des clients qui appellent ce service – qui sont bouleversés et en colère – pour qu'elle soit plus calme et plus calme. C'est un type spécifique d'émotion plus calme. Le projet vise à réduire la charge mentale des opérateurs qui ont souvent affaire à des clients frustrés et contrariés.

Par exemple, une voix aiguë et forte peut être abaissée, tandis qu'une voix masculine grave peut être élevée à un ton plus aigu. La technologie ne modifierait apparemment pas le contenu ou la formulation du discours du client et conserverait un petit élément de colère audible afin que l'opérateur puisse toujours évaluer l'état émotionnel du client. Le modèle d'IA surveille également la durée et le contenu de la conversation, envoyant un message d'avertissement s'il juge l'interaction trop longue ou offensante.

Selon des sites Web japonais, le projet de SoftBank repose sur un modèle d'intelligence artificielle qui modifie le ton et la tonalité de la voix du client en temps réel lors d'une conversation téléphonique. Les développeurs ont formé le système à l’aide d’un ensemble de données contenant plus de 10 000 données. échantillons de voix. Il s'agit de voix enregistrées par des acteurs exprimant diverses émotions, notamment des cris et des accusations.

En analysant des échantillons de voix, le modèle d'intelligence artificielle de SoftBank a appris à reconnaître et à modifier les caractéristiques vocales exprimant la colère et l'hostilité. Lorsqu'un client parle à un opérateur de centre d'appels, le modèle traite l'audio entrant et ajuste la hauteur et l'inflexion de la voix du client pour la rendre plus calme et moins menaçante.

La technologie de clonage et de synthèse vocale a fait d’énormes progrès au cours des trois dernières années. Par exemple, Microsoft a développé un système capable de cloner une voix à l'aide d'un échantillon sonore de trois secondes. Adobe a également développé des outils similaires. Softbank annonce que le système sera mis en œuvre dans son service client au premier trimestre 2026.

A lire également