Анастасия Ракова поделилась итогами работы сервиса «Поиск по архивам», который помогает изучать историю семьи по рукописным текстам

Москвичи за год более 20 миллионов раз воспользовались порталом «Поиск по архивам», куда были загружены более 5,4 миллиона страниц исторических материалов из Главархива Москвы и других источников, сообщила заместитель мэра по вопросам социального развития Анастасия Ракова.

С помощью сервиса людям стало проще искать историю своих семей. Кроме того, он помогает ученым и журналистам, а на страницах, содержащих устаревшие символы и рукописи, тренируется искусственный интеллект, отметила она.

«На протяжении нескольких последних лет запросы, связанные с поиском предков и исследованием прошлого семьи, оказываются одними из самых популярных в Главархиве Москвы. Это особенно заметно в Год семьи. Мы стремимся помочь жителям в столь важном деле и ищем способы сделать доступ к документам проще», - отметила Ракова.

Она рассказала, что несколько лет назад был открыт онлайн-сервис «Моя семья», в нем разместили оцифрованные метрические книги — документы, содержащие сведения о рождении, браке и смерти москвичей и жителей Московской губернии разных вероисповеданий.

«На основе ресурса "Моя семья" нейросеть "Поиска по архивам" училась читать рукописные тексты. За год работы сервиса к порталу обратились более 20 миллионов раз, что говорит о его популярности и необходимости. Сама же нейросеть проанализировала свыше 10 миллионов страниц исторических документов», - сказала Ракова.

Сервис «Поиск по архивам» полезен историкам, социологам, демографам, журналистам и простым москвичам. Как отметили в Соцкомплексе столицы, работать с архивными документами теперь так же легко, как с привычным поиском Яндекса.

Сейчас в «Поиске по архивам» есть документы из архивов 11 регионов, в том числе Москвы, Московской, Оренбургской, Новгородской, Иркутской, Астраханской и других областей. Всего нейросеть Яндекса распознала более 60 тысяч рукописных и печатных текстов середины XVIII — начала XX веков: в сумме это более 10 миллионов страниц, или 492 миллионов строк. В «Поиске по архивам» хранятся расшифрованные архивные дела (например, метрические книги и ревизские сказки), в которых содержится информация о людях, родившихся в России до 1917 года.

Кроме того, в сервисе собраны 3,6 миллиона оцифрованных страниц периодических изданий, таких как «Советский спорт», «Вечерняя Москва» и епархиальные ведомости.

Технология расшифровки в «Поиске по архивам» основана на оптическом распознавании символов. Нейросеть узнает утратившие актуальность знаки (например, исчезнувшие из алфавита буквы), учитывает особенности почерка и за несколько секунд преобразует трудночитаемые записи в печатный текст. Для работы с версткой газетных страниц нейросеть научили распознавать текст на огромных полосах, набранный мелким шрифтом на низкоплотной бумаге.

Напомним, «Поиск по архивам» - сервис Яндекса, который был запущен в начале 2023 года. Он помогает быстро находить упоминания людей, населенных пунктов и событий в расшифрованных нейросетью рукописных документах XVIII-XX веков.

-- mos.ru


← Экстренная ситуация? Набираем номер 112

→ Воспитанники центра для детей-сирот из Тропарево-Никулино испекли хлеб вместе с технологами известной сети супермаркетов