Как и зачем оцифровывать архивы и древние артефакты

N+1Наука

Береста на хостинге

Как и зачем оцифровывать архивы и древние артефакты

Анна Полунина при участии Эдуард Кацман

Цифровые технологии, такие как 3D-моделирование и интеллектуальный анализ текста, позволяют специалистам гуманитарных отраслей по-новому изучать древние тексты — и делать их доступными для всех. Вместе с Уральским федеральным университетом (УрФУ) рассказываем, как это происходит.

В электронном виде

С середины 90-х документы, которые хранятся в российских архивах, начали переводить «в цифру». Изначально никаких правил не было: специалисты просто старались в первую очередь оцифровать самые хрупкие, плохо сохранившиеся или ценные артефакты.

В 2004 году был принят закон «Об архивном деле в РФ». Он установил правила оценки архивных документов и порядок ведения электронных библиотек. После этого РАН, Российская государственная библиотека и другие организации, в чьем ведении находились архивы, объединились в Ассоциацию электронных библиотек. За восемь лет общими усилиями ученым удалось оцифровать более 1,6 млн страниц.

Сейчас работы по оцифровке идут практически во всех крупных архивах (подробнее об этом читайте в нашем материале «Бэкап культурного наследия»). Если говорить про российские библиотеки, то наиболее полный цифровой архив представлен в президентской библиотеке (www.prlib.ru). Другой проект — gramoty.ru — занимается оцифровкой древнерусских берестяных грамот XI–XV вв.

Но работы еще предстоит много. По оценкам экспертов, в российских библиотеках хранятся более 8 миллионов документов, которые можно считать книжными памятниками. Оцифровать их — дело не одного года и даже не одного десятилетия, потому что процесс до сих пор не автоматизирован до конца.

Отсканировать и распознать

Сначала оператор оценивает документ: его повреждения, как он сшит и насколько сильно обветшала бумага. Если состояние неудовлетворительное, документ могут отправить на реставрацию или отсканировать, но делать это придется через стекло или бесконтактно с помощью планетарного сканера: даже аккуратное прикосновение к памятнику может его повредить.

Процесс сканирования. Bernd Schwabe in Hannover / Wikimedia Commons / CC BY-SA 4.0

В идеале цифровая версия документа содержит не только графическую информацию, но и текст документа. Распознать текст — задача куда более сложная, чем сканирование. «Есть программы, которые позволяют распознать рукописный текст, но проблема заключается в том, что тексты были записаны разными людьми и разными почерками. Программисты ищут решение: как с помощью технологий машинного обучения научить компьютер “читать” различные почерки», — рассказывает куратор проекта в лаборатории цифровых технологий в историко-культурных исследованиях УрФУ Сергей Соколов (подробнее о распознавании рукописного текста читайте в нашем материале «Как в прописи»).

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Балджи у далеких ярких субмиллиметровых галактик сформировались за счет вспышек звездообразования Балджи у далеких ярких субмиллиметровых галактик сформировались за счет вспышек звездообразования

Телескопы ALMA и «Джеймс Уэбб» наблюдали балджи у субмиллиметровых галактик

N+1
«Я многого хочу от будущего партнера»: признание читательницы и комментарий психоаналитика «Я многого хочу от будущего партнера»: признание читательницы и комментарий психоаналитика

Часто после расставания мы хотим слишком многого от будущего партнера

Psychologies
Мезозойские млекопитающие и их родственники оказались обладателями однотонного темно-коричневого меха Мезозойские млекопитающие и их родственники оказались обладателями однотонного темно-коричневого меха

Палеонтологи реконструировали окраску шести маммалиаформов

N+1
Древние сапиенсы из пещеры Фумане сняли шкуры с волков и лис ради меха Древние сапиенсы из пещеры Фумане сняли шкуры с волков и лис ради меха

Иногда сапиенсы ловили волков и лис исключительно ради меха

N+1
Как быстро возбудить девушку: 12 способов (гид, который стоит держать под рукой) Как быстро возбудить девушку: 12 способов (гид, который стоит держать под рукой)

Не знаете, как быстро возбудить девушку до предела? Вы по адресу!

Playboy
Посмотрите на грустного тигра Кенни. Люди считали, что у него синдром Дауна, но все намного трагичнее Посмотрите на грустного тигра Кенни. Люди считали, что у него синдром Дауна, но все намного трагичнее

Бедное животное в интернете называют "самым уродливым тигром мира"

ТехИнсайдер
Текстовое сообщество Текстовое сообщество

Тима Радя: поэзия на улице

Weekend
Под колпаком: как травмирует материнская любовь Под колпаком: как травмирует материнская любовь

Отрывок из книги «Переживание чувств» Сьюзан Кейн

Psychologies
Большая распаковка: почему невозможно отказаться от пластика в России Большая распаковка: почему невозможно отказаться от пластика в России

Можно ли ограничить производство в России товаров из пластика?

Forbes
Стоит ли вести дела с близкими и как избежать проблем, если вы все же решились Стоит ли вести дела с близкими и как избежать проблем, если вы все же решились

Предпринимательство нередко разрушает родственные связи. Как этого избежать?

Psychologies
На переломе эпох. Lexus LX600 против Rivian R1S На переломе эпох. Lexus LX600 против Rivian R1S

Что лучше: Lexus LX600 или Rivian R1S?

4x4 Club
10 фильмов с одним актером (ну почти) 10 фильмов с одним актером (ну почти)

Кинотеатр одного актера

Maxim
Любовь и кровь: знаменитости, жестоко убитые собственными фанатами Любовь и кровь: знаменитости, жестоко убитые собственными фанатами

Случаи, когда звезды умерли именно от рук тех, кто еще недавно их боготворил

VOICE
Как правильно пользоваться стиральной машиной Как правильно пользоваться стиральной машиной

Рассказываем основные правила эксплуатации стиральных машин

CHIP
Как предотвратить старость и не стать обузой для близких: 3 простых совета Бубновского Как предотвратить старость и не стать обузой для близких: 3 простых совета Бубновского

Как оставаться активной в любом возрасте?

VOICE
Делаем аватарки с помощью нейросети: какой сервис лучше Делаем аватарки с помощью нейросети: какой сервис лучше

Какая из нейросетей лучше всего подходит для создания аватарки?

CHIP

Для некоторых планет столкновение со спутником может быть обыденным явлением

ТехИнсайдер
Почему не стоит зацикливаться на оргазме Почему не стоит зацикливаться на оргазме

Настойчивая попытка довести партнера до оргазма лишает секс самого главного

СНОБ
Балерина Анита Пудикова, сыгравшая близняшек-роботов, рассказала, как попала во вселенную Atomic Heart Балерина Анита Пудикова, сыгравшая близняшек-роботов, рассказала, как попала во вселенную Atomic Heart

Анита Пудикова — о компьютерных играх, технологиях и балете

Maxim
Где прячутся скрытые эмоции: 7 точек напряжения в теле — проверьте себя Где прячутся скрытые эмоции: 7 точек напряжения в теле — проверьте себя

Как различные эмоции влияют на напряжение мышц?

Psychologies
Возможно, первые аминокислоты возникли задолго до формирования Земли Возможно, первые аминокислоты возникли задолго до формирования Земли

Жизнь могла зародиться вместе с Млечным путем. А возможно, и раньше

ТехИнсайдер
Срочно перестаньте это делать: 11 вещей, которые ни в коем случае нельзя смывать в унитаз Срочно перестаньте это делать: 11 вещей, которые ни в коем случае нельзя смывать в унитаз

Эти 10 предметов — враги канализационных труб

ТехИнсайдер
Отрывок из нового романа Ксении Буржской «Пути сообщения» Отрывок из нового романа Ксении Буржской «Пути сообщения»

Глава из романа «Пути сообщения» — о сложном выборе ради спасения жизни другого

СНОБ
Центр единения Центр единения

Идея оформления этого интерьера началась с коллекции картин

Идеи Вашего Дома
Что нужно знать о Йозефе Биндере – пионере дизайна современных плакатов Что нужно знать о Йозефе Биндере – пионере дизайна современных плакатов

Рассказываем и показываем главное о дизайнере Йозефе Биндере

Правила жизни
Отстаньте, противные! Отстаньте, противные!

Заеды: как облегчить свое состояние?

Лиза
Устроить дом… и взять его с собой Устроить дом… и взять его с собой

Что на самом деле о нас говорят тенденции в обустройстве дома?

Psychologies
Что тревожит мужчин в сексе: 5 основных поводов для беспокойства — советы андролога Что тревожит мужчин в сексе: 5 основных поводов для беспокойства — советы андролога

Стереотипы о мужской сексуальности часто становятся источником тревоги

Psychologies
В центре Школы будущего будет стоять ребенок | At the Center of the School of the Future will be the Child В центре Школы будущего будет стоять ребенок | At the Center of the School of the Future will be the Child

Журналист Александр Мурашев — как школа может стать жизненным навигатором

Позитивные изменения
«Я обнажила грудь. Почему бы не показать ее всем?»: Настя Ивлеева рассказала о постельных сценах в «Монастыре» «Я обнажила грудь. Почему бы не показать ее всем?»: Настя Ивлеева рассказала о постельных сценах в «Монастыре»

Победив смущение, Настя Ивлеева смогла проявить профессионализм

VOICE
Открыть в приложении