Le logiciel est capable de comprendre la modulation d’une personne spécifique et de la reproduire, à condition qu’il y ait un enregistrement vocal de 20 minutes ou plus.
En plus de retravailler simplement l'ordre des mots en agissant simplement sur le texte interprété depuis le fichier-son (ce qui est relativement facile à concevoir en liant les mots à des points de bouclages particuliers dans le fichier), il permet également de resynthétiser des mots qui ne sont pas dans le fichier originel. A la différence d'un TTS habituel qui propose un modèle de voix figé, VoCo est apparemment capable d'extrapoler une modélisation de la voix à imiter.
En plus des photos-choc, il faudra se méfier des discours, désormais
Commentaire