Российские ученые разработали технологию, позволяющую искусственному интеллекту извлекать содержимое хрупких свитков и книг, не раскрывая их.
Эта инновация, созданная специалистами компании Smart Engines (SE) и Федерального исследовательского центра «Информатика и управление» РАН, поможет сохранить ценные исторические источники и снизить риски их повреждения, сообщили в SE.
Это первая в мире полностью автоматическая система виртуального развертывания свитков, не требующая вмешательства человека.
Технология позволяет получить восстановленный текст из манускрипта нажатием одной кнопки. Новая разработка применяет неразрушающий метод рентгеновской томографии и алгоритмы машинного зрения для создания цифровой копии документа, который затем анализируется.
Ученые Smart Engines обучили нейросеть на корпусе данных, включающем шесть образцов свернутых документов с нанесенными буквами, цифрами и графическими элементами.
Это позволяет системе эффективно восстанавливать текст из старинных бумажных, берестяных и серебряных свитков, а также из печатных книг, поврежденных вследствие старения, воздействия влажности или пожаров.
Мировое научное сообщество более 20 лет пыталось решить проблему анализа старых свитков с помощью томографии. Towfiqu barbhuiya на Unsplash
Эксперты отмечают, что мировое научное сообщество более 20 лет пыталось решить проблему анализа старых свитков с помощью томографии, но только сейчас удалось полностью автоматизировать процесс. Генеральный директор Smart Engines и доктор технических наук Владимир Арлазаров выразил надежду, что технология откроет новые возможности для историков, археологов и других специалистов в области гуманитарных наук.
Ожидается, что результаты работы будут представлены в августе 2024 года на Международной конференции по анализу и распознаванию документов (ICDAR) в Афинах (Греция).