Как и зачем оцифровывать архивы и древние артефакты

N+1Наука

Береста на хостинге

Как и зачем оцифровывать архивы и древние артефакты

Анна Полунина при участии Эдуард Кацман

Цифровые технологии, такие как 3D-моделирование и интеллектуальный анализ текста, позволяют специалистам гуманитарных отраслей по-новому изучать древние тексты — и делать их доступными для всех. Вместе с Уральским федеральным университетом (УрФУ) рассказываем, как это происходит.

В электронном виде

С середины 90-х документы, которые хранятся в российских архивах, начали переводить «в цифру». Изначально никаких правил не было: специалисты просто старались в первую очередь оцифровать самые хрупкие, плохо сохранившиеся или ценные артефакты.

В 2004 году был принят закон «Об архивном деле в РФ». Он установил правила оценки архивных документов и порядок ведения электронных библиотек. После этого РАН, Российская государственная библиотека и другие организации, в чьем ведении находились архивы, объединились в Ассоциацию электронных библиотек. За восемь лет общими усилиями ученым удалось оцифровать более 1,6 млн страниц.

Сейчас работы по оцифровке идут практически во всех крупных архивах (подробнее об этом читайте в нашем материале «Бэкап культурного наследия»). Если говорить про российские библиотеки, то наиболее полный цифровой архив представлен в президентской библиотеке (www.prlib.ru). Другой проект — gramoty.ru — занимается оцифровкой древнерусских берестяных грамот XI–XV вв.

Но работы еще предстоит много. По оценкам экспертов, в российских библиотеках хранятся более 8 миллионов документов, которые можно считать книжными памятниками. Оцифровать их — дело не одного года и даже не одного десятилетия, потому что процесс до сих пор не автоматизирован до конца.

Отсканировать и распознать

Сначала оператор оценивает документ: его повреждения, как он сшит и насколько сильно обветшала бумага. Если состояние неудовлетворительное, документ могут отправить на реставрацию или отсканировать, но делать это придется через стекло или бесконтактно с помощью планетарного сканера: даже аккуратное прикосновение к памятнику может его повредить.

Процесс сканирования. Bernd Schwabe in Hannover / Wikimedia Commons / CC BY-SA 4.0

В идеале цифровая версия документа содержит не только графическую информацию, но и текст документа. Распознать текст — задача куда более сложная, чем сканирование. «Есть программы, которые позволяют распознать рукописный текст, но проблема заключается в том, что тексты были записаны разными людьми и разными почерками. Программисты ищут решение: как с помощью технологий машинного обучения научить компьютер “читать” различные почерки», — рассказывает куратор проекта в лаборатории цифровых технологий в историко-культурных исследованиях УрФУ Сергей Соколов (подробнее о распознавании рукописного текста читайте в нашем материале «Как в прописи»).

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Colossal возродит новозеландских моа Colossal возродит новозеландских моа

Colossal Biosciences заявила о планах возродить новозеландских моа

N+1
Как Моррисси из героя музыкального культа превратился в парию Как Моррисси из героя музыкального культа превратился в парию

По любому вопросу у Моррисси всегда было свое, непопулярное мнение

СНОБ
Доказано: физическая активность на свежем воздухе полезнее, чем в помещении Доказано: физическая активность на свежем воздухе полезнее, чем в помещении

Как свежий воздух усиливает эффект от физической активности

ТехИнсайдер
Отпуск в Китае? Вот куда нужно съездить. Строим планы на лето! Отпуск в Китае? Вот куда нужно съездить. Строим планы на лето!

Вот что стоит посмотреть в Китае во время вашего отпуска

ТехИнсайдер
Психология ожиданий: как наши прогнозы формируют реальность Психология ожиданий: как наши прогнозы формируют реальность

Что такое ожидания и почему они имеют над тобой такую власть

VOICE
Как человеку работать рядом с роботом? Учимся внедрять ИИ в производственный процесс Как человеку работать рядом с роботом? Учимся внедрять ИИ в производственный процесс

Стоит ли опасаться того, что роботы окончательно заменят человеческий труд?

ТехИнсайдер
Геотермальная энергетика — от горячих источников до глубинных горячих пород Геотермальная энергетика — от горячих источников до глубинных горячих пород

Заставить работать глубинное тепло Земли непросто и дорого, но затраты окупаются

Наука
Кто построил высотные здания на недосягаемых горных склонах: удивительное исследование Кто построил высотные здания на недосягаемых горных склонах: удивительное исследование

Как люди смогли построить здания на горных склонах без современной техники?

ТехИнсайдер
Надевая маску Надевая маску

7 досадных ошибок, которые ты можешь допустить, используя маски для лица

Лиза
Какое растительное молоко лучше не покупать: эксперт раскрыла особенности состава популярного постного напитка Какое растительное молоко лучше не покупать: эксперт раскрыла особенности состава популярного постного напитка

На что обратить внимание, выбирая растительное молоко?

VOICE
Лайфхаки для мужской уборки: как спасти свое время и психическое здоровье Лайфхаки для мужской уборки: как спасти свое время и психическое здоровье

Занятой человек не всегда находит силы на уборку. Но без нее не обойтись…

Maxim
«Гадание сбылось»: почему так происходит и стоит ли доверять предсказанному «Гадание сбылось»: почему так происходит и стоит ли доверять предсказанному

Действительно ли предсказания и гадания имеют силу?

Psychologies
Как отключить старость Как отключить старость

Александр Суворов об одном из перспективных направлений борьбы со старением

Наука
«Какое гендерное равенство, если женщины и мужчины разные?»: 10 глупых вопросов феминистке «Какое гендерное равенство, если женщины и мужчины разные?»: 10 глупых вопросов феминистке

Феминистка развеивает главные мифы о деятельности единомышленниц

Psychologies

Новое поколение передовых методов лечения поднимает серьезные этические проблемы

ТехИнсайдер
Сдал экзамен на юриста: чего ждать от искусственного интеллекта GPT-4 Сдал экзамен на юриста: чего ждать от искусственного интеллекта GPT-4

Новая GPT-4 блестяще сдала несколько экзаменов, предназначенных для людей

Forbes
Найдены древнейшие свидетельства того, когда человек стал ездить верхом на лошади Найдены древнейшие свидетельства того, когда человек стал ездить верхом на лошади

Когда человек впервые сел на лошадь: самые ранние свидетельства

ТехИнсайдер
Экспедиция «Северный полюс-41»: что ученые нашли на глубине Северного Ледовитого океана Экспедиция «Северный полюс-41»: что ученые нашли на глубине Северного Ледовитого океана

Ученые дрейфующие в водах Северного Ледовитого океана, отбирают пробы грунта

ТехИнсайдер
Передачи-хиты советского ТВ, которые сегодня смотреть невозможно Передачи-хиты советского ТВ, которые сегодня смотреть невозможно

Деды, вспоминающие любимые программы молодости, хорошего не посоветуют

Maxim
Не только гладить вещи: 7 удивительных лайфхаков с утюгом — вы будете поражены! Не только гладить вещи: 7 удивительных лайфхаков с утюгом — вы будете поражены!

Рассказываем, как извлечь бо́льшую выгоду из обычного утюга

ТехИнсайдер
7 редких экспонатов Музея-квартиры Николая Голованова 7 редких экспонатов Музея-квартиры Николая Голованова

Удивительные предметы из коллекции музыканта Николая Голованова

Культура.РФ
Какие продукты можно есть после пищевого отравления: часы, дни, недели — восстановите организм Какие продукты можно есть после пищевого отравления: часы, дни, недели — восстановите организм

Что делать, если вы уже отравились?

Psychologies
Таяние Гренландии приближается к точке невозврата Таяние Гренландии приближается к точке невозврата

Таяние Гренландского ледового щита, скорее всего, остановить уже не удастся

ТехИнсайдер
Счет в вашу пользу. Пошаговая инструкция Счет в вашу пользу. Пошаговая инструкция

Как составить семейный бюджет, чтобы денег стало больше

Лиза
Мозг со временем признал в трансплантированном лице свое Мозг со временем признал в трансплантированном лице свое

Через сколько человек начнет узнавать свое лицо после серьезной травмы?

N+1
Букет угроз: какие киберриски из 2022-го останутся актуальными в этом году Букет угроз: какие киберриски из 2022-го останутся актуальными в этом году

В киберпространстве нарастает напряжение

Forbes
Трижды королева: как Хелен Миррен работала над ролями британских монархов. Фрагмент свежей биографии актрисы Трижды королева: как Хелен Миррен работала над ролями британских монархов. Фрагмент свежей биографии актрисы

Как Хелен Миррен работала над ролями королев

Правила жизни
Если вас травили в детстве: раны прошлого и методы самопомощи Если вас травили в детстве: раны прошлого и методы самопомощи

Как буллинг в детстве может отразиться на взрослой жизни?

Psychologies
«Я никогда не была с женатыми мужчинами»: Лолита рассказала о съёмках сериала «Актрисы» «Я никогда не была с женатыми мужчинами»: Лолита рассказала о съёмках сериала «Актрисы»

Лолита Милявская рассказала, каково ей было работать с популярным режиссером

VOICE
Всё сначала Всё сначала

Turquoise Yachts продолжает работу над необычным для себя проектом Rainbow II

Y Magazine
Открыть в приложении