Jacques a dit Publié le

La Reconnaissance vocale

Dans ce dernier épisode de la série "Jacques a dit", le smartphone répond non seulement au doigt mais aussi à la voix grâce à la reconnaissance automatique de la parole. Cette technique informatique permet d'analyser les fréquences des 36 sons de la langue française regroupés en phonèmes, qui devront ensuite être traduits en fonction de la logique de la phrase... Si votre accent ne déroute pas la machine !

Illustrée par des animations ludiques et des archives de l'Ina parfois détournées, la série "Jacques a dit" dévoile avec humour la multitude de découvertes scientifiques qui se cache derrière l'évidence du smartphone.

Un épisode de la série "Jacques a dit"

Réalisation : Philippe Cotonnec , Yoann Dhenin

Production : Ina, Universcience, Cnam

Année de production : 2015

Durée : 5min39

Accessibilité : sous-titres français

La Reconnaissance vocale

EPISODE 10: RECONNAISSANCE VOCALE

Jacques :

 Yo le jeune, prêt à triper sur ton smartphone !

GENERIQUE

Jacques :

Aujourd’hui la reconnaissance vocale, au doigt et à l’œil ? Même pas, à la voix !

Smart :

Bibibi, bi, bibibi (parle en chuchotant à son téléphone).

Voix du téléphone :

Je n'ai pas compris, veuillez répéter.

Jacques :

Vous êtes sûr que tout va bien, cher Smart, ou bien seriez-vous sujet à quelque neuronal court-circuit ?

Voix mécanique :

Vous avez bien dit : "Ma Betty chérie, tes yeux sont bleus comme le soleil", dites "confirmez"."

Jacques :

Mais c'est bien sûr ! Vous testez la reconnaissance vocale !

Archives in :

Groaaa (rugissements)

Jacques :

Agir sur les objets par la simple parole…

Archive in :

Sésame ouvre-toi !

Jacques :

…c'est renversant !

Archive in :

Ho, ça marche !

Jacques :

Contrairement à la radio, il ne s'agit plus seulement de transporter des sons,

Archives in :

Le presbytère n’a rien perdu de son charme, deux fois

Jacques :

mais de comprendre la parole humaine…

Archive In :

Tokyo

Jacques :

…et de l'interpréter.

Comment cela est-il possible ? C'est pour répondre à ce mystère que j'ai avec moi le professeur Blablablabla, qui va nous éclairer sur cette question.

Professeur blablabla:

Bonjour ami français. Au préalable, laissez-moi vous expliquer comment une machine elle peut parler.

Voix mécanique :

Bonjour

Professeur :

La machine elle transcrit un texte en phonème. Les phonèmes sont regroupés dans un alphabet des sons d'une langue. Pas moins de 36 sons différents pour la langue française.

Un mot écrit est donc transcrit en phonème, et du phonème, on passe à la traduction orale. C’est la synthèse vocale.

Voix mécanique :

Bonjour

Professeur :

Voici comment une machine peut parler, maintenant, comment peut-elle nous comprendre ? Par exemple pour lancer un appel.

Archives in :

  • S’il vous plait je voudrais parler à Monsieur Poitevin
  • Sonnerie ?

Jacques :

…gérer les paramètres de son Smartphone...

Archive in :

  • Sonnerie. Sonnerie.

Jacques :

Professeur, comment la machine parvient-elle à traduire le langage humain, en un langage formel, celui de la machine ?

Professeur :

Eh bien Jacques c'est grâce à la reconnaissance vocale, au début se faire comprendre d'une machine c'était pas gagné !

Doublage archives :

Mais dis donc t’es sacrement bien câblé toi

Professeur :

Les machines ne reconnaissaient alors que les chiffres…

Archives in :

Six

Professeur :

…De 0 à 9. Comment ça marche ?

Professeur :

Rappelons que Chaque son correspond à une combinaison de fréquence, de telle sorte que l'on peut, à partir de la représentation des fréquences vocales, retrouver ce qui a été dit.

Archive in :

Le petit chat fait sa toilette, le « teu » tout le monde sera le lire très rapidement le « cheu » aussi le « seu » aussi, et bien le reste c’est pareil !

Professeur :

Prenons un exemple : « la correspondance ».

Si chaque combinaison de fréquences est associée à un son, cela ne fait pas encore des mots ! On a donc recours encore une fois à nos amis les phonèmes.

La suite de phonèmes va ensuite être associée à des mots possibles dans un dictionnaire. Jusqu’à ce qu’il reconnaisse le bon mot !

La correspondance.

Jacques :

Mais comment la machine fait-elle pour reconnaitre le bon mot ? Il faut également qu’elle comprenne le sens n’est-il pas ?

Professeur :

Exactement, prenons un autre exemple : « Décidez lequel ? » la machine peut aussi comprenne « Des six dés, lequel »

Tu comprends ?

L'ordinateur va donc devoir analyser la phrase : son sens, mais aussi sa construction...

Examiner les différentes solutions possibles, et faire un choix statistique sur la solution la plus probable...

Archive In :

Monsieur, virgule, nouveau paragraphe suite à notre réunion de ce jour virgule

Jacques :

Alors c'en est fini des claviers ?!

Professeur

Pas totalement, car chacun s’exprime différemment…

Archives in :

Une femme parle patois

Professeur :

…La machine atteint alors ses limites

Archive in de la Toulousaine :

  • Bonjour, je pars de Paris et je vais à Toulouseuh !

Archive in chanteur :

Oh Toulouuuuseuuuh

Archives in de la toulousaine:

  • Quel jour partez-vous ?
  • Je pars demaing
  • Quel jour partez-vous ?
  • Je pars demaing

Professeur :

Ah oui, le langage parlé n’est pas toujours compris des machines

Smartphone :

Eh kakou, tu me le confirmes ton message ?

Z-6PO :

Oh ! Un ami droïde !!

Z-6PO :

Alors mon très cher ami, de quelle galaxie venez-vous donc ?

Ah, votre ligne est si parfaite, droite et généreuse, vous a-t-on déjà parlé des exploits de nos ancêtres Z6PO.

Jacques :

Ah les machines et l'amour semblent décidément faits pour se rencontrer, comme en témoigne notre traditionnelle page les Visionnaires du passé.

Les visionnaires du passé :

«  -  Je viens pour me marier

  • Votre-matricule
  • Eve 136 784 ZB
  • -Bien-mademoiselle-votre-futur-conjoint-se-nomme-Xenakis
  • Xenakis, il n’y a pas d’erreur ?
  • Nos-statistiques-sont-formelles
  • Bien, au revoir Nuptia
  • Au revoir-mademoiselle-avec-les-meilleures-vœux-de-bonheur »

Réalisation : Philippe Cotonnec , Yoann Dhenin

Production : Ina, Universcience, Cnam

Année de production : 2015

Durée : 5min39

Accessibilité : sous-titres français