Новый синтезатор речи Tacotron

6 лет назад

Компания Гугл представила своё новое устройство, которое получило название Tacotron. Это своеобразный синтезатор речи второго поколения. Благодаря использованию искусственного интеллекта, инженерам разработчикам удалось заставить устройство говорить настоящим человеческим языком, который очень сложно отличить от реального.

Над обучением искусственного интеллекта разработчики потратили наибольшее количество времени. Однако, результат того стоил. Теперь синтезатор говорит полноценным человеческим языком, используя паузы между предложениями, выдерживая нужную интонацию и даже темп разговора. Если не глядя прослушать живого человека и этот робот, то вряд ли удастся сразу отгадать, где звучит оригинал.

Для того, чтобы прибор работал исправно, специалисты решили разделить синтез речи на два отдельных этапа. Вначале система адаптирует текст в аудиограмму. Она представляет собой некое изображение последовательности звуковых частот, по типу эквалайзера. Вторая нейросеть занимается интерпретацией этого файла в звуковую речь. Таким образом, устройству больше не нужно будет для воспроизведения голоса обращаться к интернету.