Работа с цифровыми копиями архивных документов в Центральном архиве Нижегородской области

Автор: В.Н. Плотников

  • Планы оцифровки документов архива

  • Техническое обеспечение работы по оцифровке документов

  • Организация работы по оцифровке

  • Создание базы данных и её использование

Работа по переводу архивных документов в электронный формат («оцифровка») в Центральном архиве Нижегородской области (ЦАНО) была начата в 2004 году. В первую очередь были оцифрованы документы ЦАНО, включённые в Государственный реестр уникальных документов Архивного фонда Российской Федерации. В 2013 г. диски с цифровыми копиями уникальных документов направлены в Росархив для включения данных в новый межархивный интернет-проект «Государственный реестр уникальных документов Архивного фонда Российской Федерации». Уникальные документы архива также доступны для просмотра на веб-странице ЦАНО сайта государственной архивной службы Нижегородской области.

В настоящее время проводится плановый перевод в электронный вид особо ценных и наиболее востребованных архивных документов (прежде всего досоветского периода), а также оцифровываются документы по заявкам пользователей архивной информации. Оцифровка архивных документов проводится в формате JPEG в полноцветном режиме с разрешением 300 dpi.

За 2013 г. сотрудниками архива было оцифровано 1009 ед. хр. (13630 кадров) в плановом порядке, а также 4533 кадра из 753 дел по заявкам пользователей читального зала и сотрудников для исполнения запросов. По состоянию на 21.03.2014 г. в электронный вид переведено свыше 56000 ед. хр., что составляет 2,83 % их общего количества в ЦАНО.

План развития информатизации государственных казённых учреждений, подведомственных комитету по делам архивов Нижегородской области, на 2014–2020 гг., предусматривает оцифровку в ЦАНО 1300 ед. хр. в 2014 г. и 1500 ед. хр. ежегодно в 2015–2020 гг. В 2011 г. в ЦАНО был составлен перспективный план оцифровки архивных документов на 2012-2015 гг., согласно которому в течение этого периода планируется перевод в электронный вид особо ценных и наиболее востребованных фондов — ф. 2013 Коллекция Нижегородской губернской ученой архивной комиссии, рукописных книг из ф. 2636 Коллекция рукописных и старопечатных книг, склей из ф. 579 Нижегородский Печерский Вознесенский мужской монастырь, ф. 998 Макарьевский Желтоводский мужской монастырь и других. В 2013 г. на заседании дирекции ЦАНО было решено в плановом порядке оцифровывать также чертежи и планы из фонда 829 Нижегородская губернская чертёжная в связи с плохим физическим состоянием многих дел и их востребованностью среди пользователей читального зала. Оцифровка этих документов снизит риск утраты информации в случае дальнейшего ухудшения физического состояния носителя.

Первоначально для перевода документов в электронный вид использовались цифровые фотоаппараты: Olympus C-8080WZ, затем Nikon D5100, в меньшей степени — планшетные сканеры форматов А3 и А4. В 2013 г. на бюджетные средства, выделенные в рамках областной целевой программы «Информационное общество и электронное правительство Нижегородской области (2012–2014 годы)», в ЦАНО был приобретён планетарный сканер ЭЛАР ПланСкан А2ВЦ формата А2 с разрешением сканирования до 400 dpi. Данный сканер предназначен для бесконтактной оцифровки архивных документов, книг, газет, ветхих и нестандартных сшитых материалов, в том числе c плотным корешком, не позволяющим раскрыть документ более чем на 120 градусов. Качество цифровых копий, изготовленных на планетарном сканере, гораздо выше, чем полученных с помощью цифровой камеры, и сопоставимо с качеством планшетного сканера. При этом бесконтактный способ сканирования полностью исключает негативное механическое и световое воздействие на архивные дела, гарантируя их сохранность.

Кроме планетарного сканера, в 2013 г. в ЦАНО были приобретены 5 новых компьютеров для работ по оцифровке документов и для читального зала, 2 внешних жёстких диска для хранения резервных копий файлов с функцией RAID-массива, 2 специальных сейфа для хранения электронных носителей. На смену устаревшему серверу Kraftway 2004 года выпуска был приобретён новый сервер Hewlett-Pakkard, который будет установлен в 2014 г. Также было приобретено лицензионное ПО Adobe Photoshop для графической обработки полученных цифровых копий и конвертирования их в различные форматы. Техника и программное обеспечение приобретались на бюджетные средства, выделенные как по ФЦП «Культура России (2012–2018 гг.)», так и по областной целевой программы «Информационное общество и электронное правительство Нижегородской области (2012–2014 годы)».

В 2013 г. работой по оцифровке архивных документов ЦАНО занимались не только сотрудники архива, но и специалисты Корпорации ЭЛАР. В рамках государственного контракта на выполнение работ по переводу документов Центрального архива Нижегородской области в электронный вид Корпорацией ЭЛАР в 2013 г. оцифровано 24 описи и 2013 ед. хр. (свыше 55000 кадров) особо ценных и наиболее востребованных документов архива: дворянские родословные книги Нижегородской губернии XIX в., планы строений и земельных участков в г. Нижнем Новгороде и Васильском уезде Нижегородской губернии конца XVIII — начала XX вв. из архивных фондов Нижегородского губернского правления, Нижегородской городской управы, Нижегородской губернской чертёжной. Полностью оцифрован личный фонд известного нижегородского краеведа и общественного деятеля, первого председателя Нижегородской губернской учёной архивной комиссии А.С. Гациского. Все оцифрованные сотрудниками Корпорации ЭЛАР документы доступны пользователям для просмотра на компьютере в читальном зале архива.

В первые годы работы по оцифровке документов изготовленные цифровые копии хранились на жёстком диске одного из компьютеров архива. С увеличением объёмов работы по переводу архивных документов в электронный вид, когда накопленный объём информации превысил несколько сотен Гб, возникла необходимость упорядоченного хранения всех имеющихся цифровых копий с обязательным резервным копированием на внешние носители. Был разработан «Временный регламент оцифровки архивных документов в ГКУ ЦАНО», определяющий порядок работы архива по переводу документов в электронный вид с учётом имеющегося оборудования и программного обеспечения.

Для хранения, учёта и использования цифровых копий архивных документов в 2011 г. в ЦАНО на основе свободно распространяемого программного обеспечения PHP была разработана база данных «Цифровые копии архивных документов» (БД «ЦКАД»). Файлы с цифровыми фотографиями листов сотрудники ЦАНО могут заносить в базу данных с любого компьютера, подключённого к ЛВС архива. Цифровые копии при этом сохраняются как на рабочем ПК оператора, так и на жёстком диске размером 1 Тб на специально выделенном компьютере, используемом в качестве сервера БД. Еженедельно проводится резервное копирование информации на два внешних жёстких диска и рабочий компьютер заместителя директора архива. Хранение накопленной информации в четырёх разных местах практически полностью исключает её потерю.

Файлы с цифровыми копиями документов заносятся в БД в соответствии с архивным шифром дел, поэтому их поиск организован на уровне архивного шифра (№ фонда, № описи, № дела). Также вводятся заголовки и крайние даты дел, количество кадров проставляется в БД автоматически. Имеется возможность поиска информации по названиям архивных фондов и заголовкам дел. Внешний вид рабочего окна БД «ЦКАД» напоминает архивную опись (рис. 1), при нажатии мышкой на номер дела цифровые копии документов можно просматривать полистно, используя интерфейс БД (рис. 2), либо загрузить из базы копию всего дела целиком для последующего просмотра в любой подходящей программе. В этом случае в названии файлов с цифровыми копиями листов дела будет виден их полный архивный шифр, например: F2013-Op602-D68_LL01.jpeg. Также доступна выгрузка из БД описи оцифрованных дел в формате MS Excel.

Рис. 1. Вид рабочего окна базы данных в браузере

Рис. 2. Просмотр архивного документа

БД «ЦКАД» доступна через локально-вычислительную сеть всем работникам архива и пользователям читального зала. Безопасность данных обеспечивается парольной защитой и делением пользователей БД на три категории: читатель, оператор и администратор базы данных. Читатель может только просматривать на экране ПК цифровые копии документов, оператору доступна также возможность занесения информации в БД, администратору предоставлен полный контроль над системой.

Помимо упорядоченного хранения и просмотра цифровых копий архивных документов, БД обеспечивает их автоматизированный учёт: количественные показатели в листах, единицах хранения и МБ, создание перечней оцифрованных дел по фондам в формате MS Excel, статистику работы по оцифровке за определённый период, учёт работы любого из занимающихся оцифровкой документов сотрудников архива. Отчётность может быть представлена как в числовых показателях, так и в виде графиков. Наряду с автоматизированным учетом в архиве ведётся также учёт работы по оцифровке документов в традиционной форме — с помощью специально разработанного «Журнала учёта работы по оцифровке архивных документов».

БД «ЦКАД» востребована в работе архива — с её помощью посетители читального зала и сотрудники ЦАНО просматривают на экране ПК оцифрованные документы. Для обеспечения сохранности подлинников архивных дел документы полностью оцифрованных фондов выдаются пользователям читального зала и сотрудникам архива только в электронном виде для просмотра через интерфейс БД «ЦКАД».

В 2012–2013 гг. БД «ЦКАД» была передана для тестирования и использования в другие государственные казённые архивные учреждения Нижегородской области.

По состоянию на 1 января 2014 г. в БД «Цифровые копии архивных документов» занесено 52915 ед. хр. по 50 фондам архива: все уникальные документы, все документы из архивных фондов приказных изб конца XVI — начала XVIII веков, коллекция автографов русских и иностранных государственных и общественных деятелей, полководцев, писателей; особо ценные и наиболее востребованные документы из архивных фондов органов государственной власти на территории Нижегородской губернии и Нижнего Новгорода, а также документы из личных фондов нижегородцев, представляющие особый интерес, например, фронтовые письма 1941–1945 годов. Общий объём занесённой в БД информации в настоящее время составляет 748 Гб.

Другим направлением работы по оцифровке является перевод в электронный вид описей. В ЦАНО эта работа ведётся несколькими способами: путем компьютерного набора в формате DOC (для размещения на веб-странице ЦАНО сайта государственной архивной службы Нижегородской области) и сканирования в формате PDF (для размещения на сайте «Открытый текст» по договору с Нижегородским областным отделением Российского общества историков-архивистов). Также проводится заполнение раздела «Дело» программного комплекса «Архивный фонд» — основной автоматизированной системы государственного учёта архивных документов в Российской Федерации.

На веб-странице ЦАНО сайта государственной архивной службы Нижегородской области размещено 23 описи наиболее востребованных пользователями архивных фондов, в том числе ф. 570 Нижегородская духовная консистория, духовные правления и церкви Нижегородской епархии. Для размещения на сайте «Открытый текст» оцифровываются фонды органов государственной власти на территории Нижегородской области — от приказных изб XVI — нач. XVIII в. до Горьковского облисполкома. Всего переведено в электронный вид свыше 200 описей. Все оцифрованные описи доступны сотрудникам архива через локально-вычислительную сеть, а также размещены на ПК в читальном зале архива.