Google разработала специальный алгоритм, который может переводить речь с одного языка на другой, сохраняя голос говорящего и не используя текст.
"Translatotron исключает разделение задачи на этапы, что предоставляет ряд преимуществ перед каскадными моделями", - указывается в блоге компании.
Нейросеть будет обрабатывать голосовой ввод как спектрограмму, после чего на этой основе генерировать новую спектрограмму на заданном языке.
В Google отметили, что Translatotron лучше обрабатывает имена собственные и дает более точный перевод, чем базовая каскадная система.