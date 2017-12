Elle maîtrise des mots et des noms difficiles à prononcer, l'interprétation de la ponctuation, et même l'intonation pour insister sur une partie importante d'une phrase. Baptisée Tacotron 2, la technologie repose sur deux réseaux de neurones artificiels. Le premier transforme un texte en spectrogramme, à savoir une représentation visuelle dans le temps des fréquences audio. L'échantillon sonore est ensuite affiné à l'aide de WaveNet, un système alimenté par les techniques d'intelligence artificielle développées par DeepMind, filiale du groupe Alphabet/Google.

Le processus a cependant une limite de taille. Jusqu'à présent, il est capable d'imiter seulement la voix d'une seule femme. Pour les diversifier ou pour sortir des déclinaisons masculines, la firme américaine devrait former le système à nouveau depuis le début en renouvelant toutes les étapes. Tacotron 2 devrait logiquement bientôt supplanter la version précédente utilisée pour Google Traduction, mais aussi pour Google Assistant et Google Home, les majordomes virtuels accessibles via smartphone ou enceinte connectée.

