Meta développe un nouveau processus de traduction audio parole-parole en temps réel

Dans le cadre de sa quête plus large de “Connecter le monde”, Meta a développé un nouveau processus de synthèse vocale basé sur l’IA qui, idéalement, offrira finalement plus d’opportunités aux gens de se connecter, en temps réel, malgré les barrières linguistiques. barrières.

Comme vous pouvez le voir dans cet exemple, le nouveau projet Universal Speech Translator de Meta convertit l’audio parlé en hokkien, une langue principalement parlée en Chine, en audio anglais en temps réel.

Comme le hokkien est une langue moins utilisée et ne dispose pas d’un large corpus de matériel textuel disponible, Meta affirme que ce nouveau processus réduira le besoin de sortie de transcription dans la traduction – et avec Près de 3 500 langues vivantes sont principalement parlées, ce qui peut avoir un impact énorme sur la connectivité et l’engagement mondiaux.

D’après Méta :

“Bien que le modèle de traduction Hokkien soit encore un travail en cours et ne puisse traduire qu’une phrase complète à la fois, c’est un pas vers un avenir où la traduction simultanée entre les langues est possible. Les techniques que nous avons mises au point peuvent être étendues à de nombreuses autres langues écrites et non écrites.

Traduction méta-discours

Par conséquent, la vision plus large est que ces techniques peuvent être traduites dans son futur métavers, permettant une interaction plus large, à l’échelle mondiale, dans l’espace métavers.

“Nous croyons que la communication vocale peut rapprocher les gens où qu’ils soient – même dans métaverse.

Je veux dire, les applications Meta sont interdites en Chine, donc je ne suis pas sûr que cet exemple spécifique s’appliquerait ici. Mais le concept plus large est que la traduction audio facilitera une expérience métaverse de type Star Trek où chacun peut parler sa langue maternelle tout en participant à la conversation mondiale.

Ce qui est assez étonnant, et étonnant compte tenu du chemin parcouru avec les outils et les processus de traduction, et de ce que cela pourrait signifier pour les possibilités futures.

Il comprend également des opportunités de coopération commerciale et de marketing. ouvrir le monde à une connectivité plus large élargit la portée du marché et peut ouvrir un tout nouveau potentiel pour de nombreux créateurs et entreprises.

Meta utilise sa base de données de traduction Hokkien open source ainsi que le système SpeechMatrix, qui comprend une vaste collection de traductions parole-parole développées via la boîte à outils de traitement du langage naturel.

C’est une autre étape vers un monde numérique plus ouvert et connecté, pour lequel les méta-espoirs formeront l’épine dorsale de la connectivité métaverse.