Ученые научили искусственный интеллект распознавать языки

25.09.2022
244
0
0.0
Система Whisper отличает язык с акцентом, разнообразные жаргоны и шум фона.

Разработчики компании OpenAI презентовали свой новый проект — систему распознавания речи Whisper, обеспечивающую транскрипцию на нескольких языках.

Как сообщили в компании, на сегодня искусственный интеллект может распознавать до 10 языков. Также Whisper отличает язык с акцентом, разнообразные жаргоны и шум фона. По словам разработчиков, для обучения Whisper использовали 680 тысяч часов многоязычных и мультизадачных данных.

«Кроме того, он поддерживает транскрипцию на нескольких языках, а также перевод с этих языков на английский. Мы предлагаем модели и код логического вывода с открытым исходным кодом, которые служат основой для создания полезных приложений и дальнейших исследований в области надежной обработки речи», — говорится в пресс-релизе.


По словам разработчиков, архитектура Whisper представляет собой подход, реализованный в виде преобразователя кодер-декодер.

«Входной звук разбивается на 30-секундные фрагменты, преобразуется в спектрограмму log-Mel, а затем передается в кодировщик. Декодер обучен предсказывать соответствующий текстовый заголовок, смешанный со специальными токенами, которые направляют единую модель для выполнения таких задач, как идентификация языка, временные метки на уровне фраз, транскрипция многоязычной речи и перевод речи на английский язык», — говорится в сообщении.


Впрочем, отмечается, что разработчикам еще есть над чем трудиться, поскольку система подвержена большему количеству ошибок для тех носителей, чей язык недостаточно представлен в наборе обучающих данных.
Аватар enr091 Наталия Ришко
Журналист/Midgardinfo



Комментарии (0)
avatar