Как и зачем оцифровывать архивы и древние артефакты

N+1Наука

Береста на хостинге

Как и зачем оцифровывать архивы и древние артефакты

Анна Полунина при участии Эдуард Кацман

Цифровые технологии, такие как 3D-моделирование и интеллектуальный анализ текста, позволяют специалистам гуманитарных отраслей по-новому изучать древние тексты — и делать их доступными для всех. Вместе с Уральским федеральным университетом (УрФУ) рассказываем, как это происходит.

В электронном виде

С середины 90-х документы, которые хранятся в российских архивах, начали переводить «в цифру». Изначально никаких правил не было: специалисты просто старались в первую очередь оцифровать самые хрупкие, плохо сохранившиеся или ценные артефакты.

В 2004 году был принят закон «Об архивном деле в РФ». Он установил правила оценки архивных документов и порядок ведения электронных библиотек. После этого РАН, Российская государственная библиотека и другие организации, в чьем ведении находились архивы, объединились в Ассоциацию электронных библиотек. За восемь лет общими усилиями ученым удалось оцифровать более 1,6 млн страниц.

Сейчас работы по оцифровке идут практически во всех крупных архивах (подробнее об этом читайте в нашем материале «Бэкап культурного наследия»). Если говорить про российские библиотеки, то наиболее полный цифровой архив представлен в президентской библиотеке (www.prlib.ru). Другой проект — gramoty.ru — занимается оцифровкой древнерусских берестяных грамот XI–XV вв.

Но работы еще предстоит много. По оценкам экспертов, в российских библиотеках хранятся более 8 миллионов документов, которые можно считать книжными памятниками. Оцифровать их — дело не одного года и даже не одного десятилетия, потому что процесс до сих пор не автоматизирован до конца.

Отсканировать и распознать

Сначала оператор оценивает документ: его повреждения, как он сшит и насколько сильно обветшала бумага. Если состояние неудовлетворительное, документ могут отправить на реставрацию или отсканировать, но делать это придется через стекло или бесконтактно с помощью планетарного сканера: даже аккуратное прикосновение к памятнику может его повредить.

Процесс сканирования. Bernd Schwabe in Hannover / Wikimedia Commons / CC BY-SA 4.0

В идеале цифровая версия документа содержит не только графическую информацию, но и текст документа. Распознать текст — задача куда более сложная, чем сканирование. «Есть программы, которые позволяют распознать рукописный текст, но проблема заключается в том, что тексты были записаны разными людьми и разными почерками. Программисты ищут решение: как с помощью технологий машинного обучения научить компьютер “читать” различные почерки», — рассказывает куратор проекта в лаборатории цифровых технологий в историко-культурных исследованиях УрФУ Сергей Соколов (подробнее о распознавании рукописного текста читайте в нашем материале «Как в прописи»).

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Глубокое обучение привлекли к проблеме аномального магнитного момента мюона Глубокое обучение привлекли к проблеме аномального магнитного момента мюона

Нейросеть пригодится в будущих экспериментах повышенной светимости

N+1
Как Анахита Ратебзад добивалась гендерного равенства в Афганистане, но потеряла все Как Анахита Ратебзад добивалась гендерного равенства в Афганистане, но потеряла все

История женщины, которая слишком опередила свое время

Forbes
Черная дыра промежуточной массы выдала себя пролетами сквозь аккреционный поток вблизи сверхмассивной черной дыры Черная дыра промежуточной массы выдала себя пролетами сквозь аккреционный поток вблизи сверхмассивной черной дыры

Пара из сверхмассивной черной дыры и черной дыры промежуточной массы

N+1
Сложная проблема Сложная проблема

Рассеянный склероз: что это за болезнь и как она проявляется?

Лиза
4 правила секс-безопасности в командировке 4 правила секс-безопасности в командировке

Как сделать так, чтобы секс в командировке принес только яркие впечатления

Psychologies
Недоброе тепло: как грузинские дровосеки нашли советские «атомные батарейки» Недоброе тепло: как грузинские дровосеки нашли советские «атомные батарейки»

Из этой статьи ты узнаешь о людях, которые согрелись с помощью радиации

Maxim
Балаяж: 9 вариантов окрашивания волос и советы экспертов по уходу Балаяж: 9 вариантов окрашивания волос и советы экспертов по уходу

Одна из самых популярных техник осветления

РБК
Новая точка туристического притяжения Новая точка туристического притяжения

Всесезонные возможности для отдыха на алтайском курорте «Манжерок»

Деньги
Древние сапиенсы из пещеры Фумане сняли шкуры с волков и лис ради меха Древние сапиенсы из пещеры Фумане сняли шкуры с волков и лис ради меха

Иногда сапиенсы ловили волков и лис исключительно ради меха

N+1
Почему в мировых музеях мало работ женщин и как кураторы пытаются это изменить Почему в мировых музеях мало работ женщин и как кураторы пытаются это изменить

Как художественные институции пересматривают канон в пользу гендерного баланса

Forbes
Мозг со временем признал в трансплантированном лице свое Мозг со временем признал в трансплантированном лице свое

Через сколько человек начнет узнавать свое лицо после серьезной травмы?

N+1
«Почему мужчина так себя ведет?»: как решать проблемы в отношениях— 4 типичных примера «Почему мужчина так себя ведет?»: как решать проблемы в отношениях— 4 типичных примера

Как не превратить противоречия в конфликт?

Psychologies
Почему выпадают волосы? Почему выпадают волосы?

От чего зависит здоровье волос?

Здоровье
Чего на самом деле желает ребенок, когда ничего не хочет делать: мнение психолога Чего на самом деле желает ребенок, когда ничего не хочет делать: мнение психолога

Ребенок не хочет готовиться к концерту или отказывается делать уроки?

VOICE
Быстрее гиперзвука: величайший космический рекорд, поставленный крышкой от люка Быстрее гиперзвука: величайший космический рекорд, поставленный крышкой от люка

Нет ничего удивительного в том, что инопланетяне не вступают с нами в контакт

Maxim
«Инвалид» и «псих»: что такое психофобная лексика и почему ее не стоит употреблять «Инвалид» и «псих»: что такое психофобная лексика и почему ее не стоит употреблять

Что такое эйблизм и психофобная лексика, и как изменить язык на пользу обществу?

Forbes
Почему нельзя будить лунатиков Почему нельзя будить лунатиков

Как себя вести с лунатиками?

ТехИнсайдер
Корень инфантилизма: почему мы не можем взять ответственность за собственную жизнь Корень инфантилизма: почему мы не можем взять ответственность за собственную жизнь

В чем заключаются причины инфантильного поведения?

Forbes
Как выглядит кожа женщины, сбросившей 71 килограмм: почему лучше не набирать вес, чем потом худеть Как выглядит кожа женщины, сбросившей 71 килограмм: почему лучше не набирать вес, чем потом худеть

Как выглядит девушка, похудевшая на 71 килограмм

VOICE
И такое возможно: а вы знали, что женщина может сразу забеременеть от двоих мужчин? И такое возможно: а вы знали, что женщина может сразу забеременеть от двоих мужчин?

Можно ли повторно забеременеть во время беременности?

ТехИнсайдер
Общение без раздражения: 5 правил коммуникации с пожилыми родителями Общение без раздражения: 5 правил коммуникации с пожилыми родителями

Пять вещей, которые важно помнить в момент заботы о престарелых родственниках

Psychologies
10 вопросов, которые помогут вам понять цели и построить стратегию карьерного роста 10 вопросов, которые помогут вам понять цели и построить стратегию карьерного роста

Умение задавать правильные вопросы — одна из ключевых компетенций коуча

Psychologies
Витамин D: новая панацея? Витамин D: новая панацея?

Как витамин D стал самым популярным БАДом

Эксперт
Макросы для клавиатуры и мыши: что это и как их создать Макросы для клавиатуры и мыши: что это и как их создать

Рассказываем, что такое макросы, чем они полезны и как их создать

CHIP
Скандал с отцом 8-летней фигуристки: почему родители унижают детей-спортсменов — история Мирославы и Михаила Лебедевых Скандал с отцом 8-летней фигуристки: почему родители унижают детей-спортсменов — история Мирославы и Михаила Лебедевых

Почему родители готовы жертвовать здоровьем ребенка ради чемпионства?

Psychologies
Правила жизни Спайка Ли Правила жизни Спайка Ли

Правила жизни режиссера Спайка Ли

Правила жизни
Время для размышлений и тревог: как научиться отключаться перед сном — 4 простых шага Время для размышлений и тревог: как научиться отключаться перед сном — 4 простых шага

Как заставить себя спать?

Psychologies
Молния, ветер со скоростью 1600 км в час, кислотный дождь: самая экстремальная погода в Солнечной системе Молния, ветер со скоростью 1600 км в час, кислотный дождь: самая экстремальная погода в Солнечной системе

Земля — действительно райское место, если сравнивать ее с другими планетами

ТехИнсайдер
Французская кошка Французская кошка

Актриса Валери Зоидова говорит, что раскрывать женские характеры интересно

OK!
Самые уродливые внедорожники всех времён и народов Самые уродливые внедорожники всех времён и народов

Внедорожники, которые своим внешним видом могут превратить вашу жизнь в хоррор

4x4 Club
Открыть в приложении