/ /
Яндекс обновил русско-удмуртский переводчик

Яндекс обновил русско-удмуртский переводчик

Яндекс обновил русско-удмуртский переводчик

Андрей Михеев, заместитель руководителя проекта «Языки народов России» ООО «Яндекс», заявил об обновлении русско-удмуртского переводчика.

В конце 2024 года Яндексу были переданы 100 тысяч параллельных русско-удмуртских предложений, подготовленных при финансовой поддержке Правительства УР, благодаря совместной работе Удмуртского государственного университета, Удмуртского федерального исследовательского центра УрО РАН, Всеудмуртской организации «Удмурт Кенеш» и Министерства национальной политики УР. Кроме того, в начале 2025 года, в рамках соглашения между УдмФИЦ УрО РАН и Яндексом, подписанным в декабре 2024 года, Яндексу был передан моноязычный корпус удмуртского языка. Эти данные были использованы для обучения нейронной сети, что позволило значительно повысить качество перевода. Теперь пользователи смогут получать более точные и естественные переводы.

Попробовать переводчик можно здесь.

«Модель перевода для удмуртского языка появилась в Яндексе еще в апреле 2016 г. и с тех пор почти не менялась, хотя технологии машинного перевода за это время сделали большой шаг вперед. В рамках проекта «Языки народов России» мы обучили нейросетевую модель перевода с использованием новых данных; причем дополнительно улучшить качество удалось за счёт обучения модели одновременно для нескольких финно-угорских языков, в том числе марийского и коми. По нашим замерам, качество перевода превосходит и Google, и большие языковые модели, такие как Claude. По соглашению с УдмФИЦ в ближайшие годы работа по расширению паралелльного корпуса для удмуртского языка будет продолжена, что, несомненно, положительно скажется и на качестве перевода. К тому же в настоящее время ведется работа по синтезу и распознаванию для удмуртского языка», — отметил Андрей Михеев.

Я бы сказала, что качество перевода улучшилось значительно и в целом стало даже лучше перевода, который выдает сейчас Google (особенно хорошо это видно на примере перевода небольших сказок, хотя, как показывают примеры, перевод текстов, содержащих новости, у Google и Яндекса примерно на одном уровне)

Мария Безенова, руководитель проекта по созданию Национального корпуса удмуртского языка.