Mais nous sommes passés par une phase de stagnation
Finalement au bout de quelques années nous nous sommes rendu compte qu’entre un programme pouvant comprendre des instructions simples et un vrai langage, il y avait un pas de géant. Mon impression est qu’au début des années 2000 l’intérêt pour les technologies du langage ont décru. La traduction automatique est restée intéressante, mais la compréhension du langage est resté en arrière. Puis les technologies type Machine Learning sont arrivées, et avec elles les puissances de calcul permettant de travailler sur d'énormes ensembles de données pour enfin obtenir une robustesse acceptable dans la compréhension du langage, malgré ses imperfections. Mais si les progrès sont impressionnants, le langage reste une affaire complexe et la plupart des acteurs du domaine ont compris les limites de la technologie.
Aujourd’hui l’hybride est la norme
Je connais en effet peu d’acteurs aujourd’hui misant sur une compréhension sans limite du langage humain par un ordinateur. Prenons deux exemples que je connais bien. Nos amis de chez Authôt qui font de la transcription audio et nous chez Pipplet.
Authôt utilise de l’intelligence artificielle pour analyser le flux audio/vidéo et transcrire. Le taux de fiabilité de cette technologie de reconnaissance automatique de la parole est de 95%. En fonction de l’accent ou de l’environnement sonore certains éléments peuvent être mal compris. Dans ce cas Authôt propose une version hybride, avec relecture par des professionnels. Nous sommes donc dans un hybride 95% Automatique / 5% humain. À l’inverse chez Pipplet nous serions plutôt 99% humain, 1% automatique.
Nous faisons de l’évaluation du niveau de langue. Nous fournissons à des entreprises une validation du niveau de langue d’une personne. Impossible de se passer sur des modèles automatisés, votre téléphone ne vous comprend déjà pas toujours lorsque vous lui demandez “Appeler Maman”, alors il ne saura pas de si tôt valider que vous mettez vos ‘s’ à la troisième personne du singulier en anglais. Notre évaluation repose donc à 100% sur des professionnels, humains. La technologie nous permet cependant d’aider nos professionnels experts à mieux identifier certaines erreurs.