В рамках федерального форума «Цифровой алмаз» состоялась сессия «Технологии искусственного интеллекта для исследования семейной истории». Общественности был представлен проект компании «Яндекс» под названием «Поиск по архивам», позволяющий находить и изучать архивные документы с помощью нейросетей. Якутия также стала участником этого проекта, поэтому фонды Национального архива республики станут доступнее, что позволит совершенствовать исследования в области истории, краеведения и генеалогии.
В качестве спикеров мероприятия выступили министр культуры и духовного развития Республики Саха (Якутия) Афанасий Ноев, директор Национального архива Якутии Пётр Румянцев, начальник отдела информационных услуг Национального архива Якутии Екатерина Сергеенко, заместитель руководителя проекта «Поиск по архивам» компании «Яндекс» Андрей Михеев.
Национальный архив Республики Саха (Якутия) начиная с прошлого десятилетия активно проводит работу по цифровизации своей деятельности. За это время была осуществлена оцифровка архивных документов разных периодов истории Якутии. Существенные успехи коллективом архива достигнуты в деле оцифровки фондов дореволюционного периода. Большим спросом у населения пользуются материалы, связанные с изучением родословных. Это метрические книги церквей, ревизские сказки, посемейные списки, материалы переписей населения и другие ценные источники.
Министр культуры и духовного развития Республики Саха (Якутия) Афанасий Ноев в своём выступлении отметил, что в контексте воспитания позитивных нравственных ценностей, деятельность архивных учреждений и проводимые генеалогические исследования имеют ключевое значение. Было сказано, что поиски новых решений, одним из которых стало применение искусственного интеллекта в архивном деле, позволят качественно развить многие аспекты исследовательской, культурной и духовной жизни общества.
Начальник отдела информационных услуг Национального архива Якутии Екатерина Сергеенко является одним из ведущих экспертов по составлению родословных в нашей республике. Она подчеркнула, что интерес граждан к изучению генеалогии с каждым годом всё более увеличивается. Было сказано, что именно исходя из этой потребности состоялась цифровизация фондов архива.
Прежде доступ к документам осуществлялся непосредственно в ходе личного посещения учреждения. В настоящее время главный архив республики осуществляет деятельность через сеть Интернет. Так, в ноябре 2019 года для пользователей был открыт удалённый бесплатный доступ к базе данных архива. Это стало возможным благодаря самой оцифровке материалов, а также введению в эксплуатацию информационной системы «Элар» (АИС Элар-Архив). Главными достижениями стали обеспечение сохранности оригиналов документов, ускорение и возможность работы над материалами в режиме онлайн. Так, на момент сентября 2024 года было зафиксировано 36 тысяч обращений к электронной архивной системе.
Основную суть проекта «Поиск по архивам» представил Андрей Михеев. Сервис «Поиск по архивам» позволяет посредством алгоритмов искусственного интеллекта находить имена, фамилии, названия населённых пунктов и любые другие слова в рукописных документах XVIII — начала XX века. Главный упор был сделан именно на генеалогические исследования.
Принцип работы таков: все архивные документы загружаются на сервер проекта, затем нейросеть распознает текст и на основе этого можно выявить ключевые слова, по которым находится искомый архивный материал. Помимо классических документов сервис предоставляет доступ к периодическим и справочным документам разных периодов истории. Например, пользователи уже в настоящее время могут ознакомиться со страницами «Голоса Якутской Церкви» — печатного органа Якутской и Вилюйской епархии, издававшегося в 1918–1920 гг.
Сейчас в базе проекта имеется около 15,5 миллионов архивных документов из 18 регионов России. Национальный архив Республики Саха (Якутия) стал одним из участником проекта, поэтому в скором времени его архивные материалы станут ещё доступнее для ознакомления и изучения благодаря технологиям искусственного интеллекта.
Александр Герасимов,
keskil14.ru