Аспирант Института математики и информатики Северо-Восточного федерального университета работает над разработкой нейросети, которая позволит создавать онлайн-переводчики с якутского на другие языки. Данный проект реализуется на средства гранта Российского фонда фундаментальных исследований и завершится в сентябре, сообщает пресс-служба вуза.
«На сегодня нейросеть, обученная на видеоускорителе RTX 3070 Ti, еще не выдает полностью связный текст, но подходящие дифтонги в 50% случаев подставляет верные. Тем не менее план работ перевыполнен, поскольку создание нейросети планировалось реализовать в середине 2022 года», – делится молодой ученый Иннокентий Иванов.
Для создания нейронной сети ученый использовал текстовые версии веб-ресурсов якутских СМИ. К марту-апрелю завершится наполнение базы данных. В качестве предварительной обученной модели выбрана ruGPT-3 от Сбера.
В планах молодого ученого – улучшить качество генерации текста и проработать его практическое применение.
«Следует внимательно отнестись к склонениям слов, дифтонгам. Смысл созданного нейронной сетью текста может исчезнуть после очередного неправильного склонения слов», – подчеркивает молодой ученый.
По итогам проекта Иннокентий Иванов планирует опубликовать модель нейронной сети в открытом доступе – она является многоцелевой и не заточена под конкретную задачу, ее применение возможно в широком спектре программ и приложений. По мнению аспиранта СВФУ, таким образом сервис на якутском языке можно оперативно добавить в свой продукт – в свою очередь это откроет возможности для мгновенного перевода текста, общения с техподдержкой и многое другое.
Источник: ulus.media