Как и зачем оцифровывать архивы и древние артефакты

N+1Наука

Береста на хостинге

Как и зачем оцифровывать архивы и древние артефакты

Анна Полунина при участии Эдуард Кацман

Цифровые технологии, такие как 3D-моделирование и интеллектуальный анализ текста, позволяют специалистам гуманитарных отраслей по-новому изучать древние тексты — и делать их доступными для всех. Вместе с Уральским федеральным университетом (УрФУ) рассказываем, как это происходит.

В электронном виде

С середины 90-х документы, которые хранятся в российских архивах, начали переводить «в цифру». Изначально никаких правил не было: специалисты просто старались в первую очередь оцифровать самые хрупкие, плохо сохранившиеся или ценные артефакты.

В 2004 году был принят закон «Об архивном деле в РФ». Он установил правила оценки архивных документов и порядок ведения электронных библиотек. После этого РАН, Российская государственная библиотека и другие организации, в чьем ведении находились архивы, объединились в Ассоциацию электронных библиотек. За восемь лет общими усилиями ученым удалось оцифровать более 1,6 млн страниц.

Сейчас работы по оцифровке идут практически во всех крупных архивах (подробнее об этом читайте в нашем материале «Бэкап культурного наследия»). Если говорить про российские библиотеки, то наиболее полный цифровой архив представлен в президентской библиотеке (www.prlib.ru). Другой проект — gramoty.ru — занимается оцифровкой древнерусских берестяных грамот XI–XV вв.

Но работы еще предстоит много. По оценкам экспертов, в российских библиотеках хранятся более 8 миллионов документов, которые можно считать книжными памятниками. Оцифровать их — дело не одного года и даже не одного десятилетия, потому что процесс до сих пор не автоматизирован до конца.

Отсканировать и распознать

Сначала оператор оценивает документ: его повреждения, как он сшит и насколько сильно обветшала бумага. Если состояние неудовлетворительное, документ могут отправить на реставрацию или отсканировать, но делать это придется через стекло или бесконтактно с помощью планетарного сканера: даже аккуратное прикосновение к памятнику может его повредить.

Процесс сканирования. Bernd Schwabe in Hannover / Wikimedia Commons / CC BY-SA 4.0

В идеале цифровая версия документа содержит не только графическую информацию, но и текст документа. Распознать текст — задача куда более сложная, чем сканирование. «Есть программы, которые позволяют распознать рукописный текст, но проблема заключается в том, что тексты были записаны разными людьми и разными почерками. Программисты ищут решение: как с помощью технологий машинного обучения научить компьютер “читать” различные почерки», — рассказывает куратор проекта в лаборатории цифровых технологий в историко-культурных исследованиях УрФУ Сергей Соколов (подробнее о распознавании рукописного текста читайте в нашем материале «Как в прописи»).

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

CAR-NK-терапия из донорских стволовых клеток помогла пациентке с системной склеродермией CAR-NK-терапия из донорских стволовых клеток помогла пациентке с системной склеродермией

Исследователи сообщили об успешном лечении тяжелой системной склеродермии

N+1
Отрывок из книжного сериала Антон Секисова «Комната Вагинова» Отрывок из книжного сериала Антон Секисова «Комната Вагинова»

Жизнь в петербургской коммуналке глазами Антона Секисова

СНОБ
Стремечко назвали идеальной костью для палеогеномного исследования Стремечко назвали идеальной костью для палеогеномного исследования

Почему при анализе древней ДНК нужно отдавать предпочтение стремечку

N+1
Все, везде и после Все, везде и после

Как «Рожденные в СССР» зафиксировали конец Холодной войны

Weekend
5 сверхспособностей, которые станут доступны людям уже через 5 лет по версии футурологов 5 сверхспособностей, которые станут доступны людям уже через 5 лет по версии футурологов

Какие «суперспособности» станут реальностью уже к 2030 году — и какой ценой?

Maxim
На АвтоВАЗе стартовало производство обновленной Lada Vesta На АвтоВАЗе стартовало производство обновленной Lada Vesta

АвтоВАЗ возобновил производство модернизированной Lada Vesta

РБК
Как создать уют на кухне Как создать уют на кухне

10 простых и бюджетных способов преобразить свою кухню

Лиза
Испытание морем Испытание морем

Увидеть далекие арктические острова – об этом мечтают многие путешественники

Отдых в России
Искусственный интеллект: проворный помощник или коварный поработитель? Искусственный интеллект: проворный помощник или коварный поработитель?

Как работает искусственный интеллект, для чего его уже сейчас используют

ТехИнсайдер
Сквозь эпохи: 7 книг о том, как жили женщины в России Сквозь эпохи: 7 книг о том, как жили женщины в России

Семь книг о сложных судьбах женщин в России

Правила жизни
Да здравствует вчерашний день: почему мы так любим ностальгию Да здравствует вчерашний день: почему мы так любим ностальгию

По чему ностальгируют разные поколения?

РБК
«Наступает эпоха умного ESG» «Наступает эпоха умного ESG»

Почему важно придерживаться принципов устойчивого развития

Деньги
Что делать, если близкие не поддерживают ваши начинания: 7 шагов Что делать, если близкие не поддерживают ваши начинания: 7 шагов

Почему близкие могут отказывать в одобрении и как без него идти за мечтой

Psychologies
Ходим парой Ходим парой

Почему женская дружба может быть одной из самых важных вещей на свете

Лиза
Что такое искусственная кома и чем она отличается от обычной Что такое искусственная кома и чем она отличается от обычной

Зачем человека специально вводят в кому?

ТехИнсайдер
5 причин почитать «Орбиту смерти» канадского астронавта Криса Хэдфилда 5 причин почитать «Орбиту смерти» канадского астронавта Криса Хэдфилда

На русском вышел роман «Орбита смерти», написанный астронавтом Крисом Хэдфилдом

ТехИнсайдер
«В душе я обыватель» «В душе я обыватель»

Петр Тодоровский о своем фильме «Здоровый человек»

Weekend
«Один — за троих»: что умеет GPT-4 и как он изменит работу людей «Один — за троих»: что умеет GPT-4 и как он изменит работу людей

Как GPT-4 изменит рынок труда

Inc.
Возраст и рацион: как с помощью диеты сохранить активность и здоровье Возраст и рацион: как с помощью диеты сохранить активность и здоровье

Есть ли взаимосвязь возраста и режима питания?

РБК
Как жалит муравей-пуля, самый опасный муравей в мире Как жалит муравей-пуля, самый опасный муравей в мире

Как муравей-пуля, или Paraponera clavata, получил свое название?

ТехИнсайдер
7 самых замечательных ролей Педро Паскаля 7 самых замечательных ролей Педро Паскаля

Не во всех своих фильмах Педро Паскаль спасает VIP-детей

Maxim
Что нужно знать, чтобы посмотреть «Джон Уик — 4»: вспоминаем первые три серии Что нужно знать, чтобы посмотреть «Джон Уик — 4»: вспоминаем первые три серии

Сюжет, персонажи и любопытные факты о всех фильмах «Джон Уик»

Maxim
«Почему мужчина так себя ведет?»: как решать проблемы в отношениях— 4 типичных примера «Почему мужчина так себя ведет?»: как решать проблемы в отношениях— 4 типичных примера

Как не превратить противоречия в конфликт?

Psychologies
Час расплаты: истории трех девушек, которые попали в кредитную кабалу Час расплаты: истории трех девушек, которые попали в кредитную кабалу

Взяла один кредит, потом другой, а дальше долги стали множиться

VOICE
Какие продукты можно есть после пищевого отравления: часы, дни, недели — восстановите организм Какие продукты можно есть после пищевого отравления: часы, дни, недели — восстановите организм

Что делать, если вы уже отравились?

Psychologies
Великий пост: кто, почему и зачем отказывается от еды — истории читательниц и комментарии психологов Великий пост: кто, почему и зачем отказывается от еды — истории читательниц и комментарии психологов

В чем смысл длительного физического и духовного воздержания?

Psychologies
Как IT-сервисы проходят путь от внутреннего инструмента до публичного решения Как IT-сервисы проходят путь от внутреннего инструмента до публичного решения

Как множество компаний создают внутренние инструменты для своих целей

Forbes
Окситоцин помог рыбкам данио-рерио проявить эмпатию к страдающим сородичам Окситоцин помог рыбкам данио-рерио проявить эмпатию к страдающим сородичам

Механизм проявления эмпатии у рыбок похож на аналогичный у млекопитающих

N+1
Как основатель Bolt нанял мошенника для создания криптопроекта Movement DAO Как основатель Bolt нанял мошенника для создания криптопроекта Movement DAO

Райан Бреслоу ввязался в судебное разбирательство по поводу предполагаемой кражи

Forbes
5 невероятных технологий будущего, которыми мы пользуемся каждый день 5 невероятных технологий будущего, которыми мы пользуемся каждый день

Еще несколько лет назад о таких технологиях только мечтали писатели-фантасты

Maxim
Открыть в приложении