Tecnología

Google crea una voz sintética casi idéntica a la generada por los humanos

Denominada Tacotron 2, puede interpretar diversas entonaciones y reconocer signos de puntuación, una modalidad que la hace indistinguible a las voces generadas por una persona.

Google
Foto: Pixabay

Al momento, las voces utilizadas por los asistentes virtuales disponibles en el mercado aún pueden sonar artificiales. Sin embargo, Google acaba de presentar una investigación donde asegura que pudo crear un sistema de lectura de texto a voz que tiene la virtud de imitar la entonación humana.

Denominado Tacotron 2, es la segunda generación de una tecnología desarrollada por Google, cuyo funcionamiento está basado en dos redes neuronales que interpretan el texto y aplican los efectos, pausas y entonaciones presentes en el documento junto a WaveNet, el software responsable de generar las voces de Google Assistant.

Entre las características más destacadas de Tacotron 2 está la capacidad de pronunciar nombres y palabras, distinguir signos de puntuación o si una parte del texto requiere ser remarcada con una entonación más destacada.

Foto: google
Foto: google

De hecho, Google puso a disposición las pistas de audio generadas de forma sintética con sus redes de inteligencia artificial junto a otras pistas relatadas por humanos, con un desempeño perfecto con palabras y frases complejas.

Por el momento Tacotron 2 se encuentra en una etapa de evaluación, disponible sólo en inglés y con una voz femenina — que puede escucharse haciendo click aquí—, aunque se espera que Google entrenar en otros formatos, con una versión masculina y en otros idiomas. De esta forma, la compañía de Internet planea en el corto plazo perfeccionar aún más los sistemas guiados por voz como Assistant.

Reportar error
Enviado
Error
Reportar error
Temas relacionados