Организация архива электронных документов. Практические аспекты и перспективы

Автор: С.Л. Кузнецов

С.Л. Кузнецов, к.и.н.1

  • Комплектование

  • Электронный архив как часть СЭД

  • Оцифровка документов (ретроконверсия)

  • Статус: документ или часть НСА?

  • Экспертиза ценности и передача на гос. хранение

  • Перспективы электронных архивов

Сегодня большинство организаций всех форм собственности имеют ту или иную систему электронного документооборота. Все шире практикуется обмен документами в электронной форме не только между государственными органами по системе МЭДО, но и между коммерческими организациями. Государственные органы должны завершить переход на электронный документооборот 31 декабря 2016 года.2 Определен порядок и формы обмена документами в электронном виде.3 Все это выводит в число первоочередных задач службы ДОУ организацию электронного архива. Кроме того, все больше организаций ставят задачу оцифровки уже существующего традиционного архива – как с целью повышения эффективности его использования, так и для обеспечения сохранности оригиналов на бумаге, выводу их из обращения, а зачастую – и для снижения расходов на хранение архивных документов.

Организацию электронного архива можно разделить на несколько направлений:

Организация программно-аппаратного комплекса архива

Комплектование архива

Организация использования документов электронного архива

Организация хранения и обеспечение сохранности.

С точки зрения организации ведомственного хранения оптимальным вариантом является использование единой корпоративной информационной системы (КИС), обладающей функционалом как СЭД, так и электронного архива и обеспечивающей единую точку доступа к документам, систему хранения и работы с документами как на стадии текущего делопроизводства, так и на этапе архивного хранения.

В систему документы текущего делопроизводства поступают несколькими путями: создаются в организации, поступают по электронным каналам связи в виде электронных документов или электронных образов документов, поступают в традиционной бумажной форме с последующим сканированием (оцифровкой).

Документы за прошлые годы поступают в систему в случае принятия решения о проведении ретроспективного сканирования (ретроконверсии), которое может осуществляться как силами сотрудников службы ДОУ и архива, так и путем привлечения сторонней организации.

Развертывание двух отдельных программ – СЭД и электронного архива - затрудняет выполнение поиска и подбора документов (приходится осуществлять поиск в двух системах по очереди). Возникает дополнительный объем работ – передача соответствующего годового раздела из СЭД в электронный архив. При этом важно, чтобы документы, завершенные в делопроизводстве, не только получали отметку в карточке документа «архивный», но и поддерживался весь необходимый функционал: составление описей, внутренних описей, реестров электронных документов и других документов, создающихся в ведомственном архиве в соответствии с Правилами,4 поддерживали информацию о номере описи, номере дела, заголовке дела, местонахождении дела (стеллаж, полка), о номере единицы хранения, на которую записана резервная копия данного документа, дате последней проверки носителя и другие сведения, фиксируемые в карточке архивного документа.

Зачастую разделение баз документов текущего делопроизводства и архива обосновывается IT-службой большим размером базы, требующей повышенных аппаратных ресурсов. Однако практика показывает, что эта проблема встречается в том случае, если файл БД используется для хранения всех документов системы. При разделении на БД с метаданными и отдельном хранении файлов документов проблем с использованием СЭД, включающей несколько миллионов документов, не наблюдается. Естественно, что для пользователя карточка документа включает и прикрепленные к ней файлы.

Следующий вопрос – наполнение системы. «Правила организации хранения, комплектования, учета и использования документов Архивного фонда Российской Федерации…» предусматривают передачу документов в архив в формате PDF/A. При этом документы временного (до 10 лет) срока хранения остаются в тех форматах, в которых они были созданы. Для документов долговременного и постоянного срока хранения осуществляется преобразование в формат PDF/A. На практике создание файлов в pdf не исключает параллельного хранения документов в исходных форматах.

На сегодняшний день значительная часть документов в СЭД – это электронные образы традиционных документов. Поэтому отдельное направление работы службы ДОУ – это оцифровка (сканирование и индексация) как поступающих, так и уже хранящихся в архиве документов.

При организации сканирования важно правильно подобрать подходящее оборудование. Для документов текущего делопроизводства это обычно потоковые сканеры. При их выборе надо обращать внимание на реальную производительность при сканировании с разрешением 300-400-600 dpi и глубиной цветности 24 bit (полноцветное сканирование), необходимое для создания страховых копий. Другое, на что надо обратить внимание, – наличие датчиков протяжки бумаги, быстро останавливающих автоподатчик в случае слипания листов бумаги и, что особенно важно, при попадании в него сшитых (скрепленных) документов. Тут надо отметить, что даже самые ответственные и опытные сотрудники могут уставать, отвлекаться, и не имеющий датчиков сканер (МФУ) может «зажевать» важный документ, поэтому на наличие этой функции, на наш взгляд, надо обязательно обратить внимание.

При принятии решения о сканировании документов за прошлые годы (ретроконверсии) необходимо ответить на несколько вопросов: что вы будете сканировать, на каком оборудовании, в каком формате сохранять и как обрабатывать.

1. Что сканировать? В каких-то случаях принимается решение об оцифровке всего архива. Но это трудоемкая и дорогая операция. Поэтому предварительно необходимо оценить степень использования, сохранность, ценность архивных документов.

Какие задачи преследует оцифровка архива? Это вывод бумажных оригиналов из обращения, чем достигается их сохранность, и, с другой стороны, кардинальное упрощение доступа к архивным документам, ввод их в активный оборот, обеспечение легкого доступа к документам, в том числе и удаленного доступа через Интернет, возможность выполнения сложных тематических запросов, используя механизмы полнотекстового поиска, возможность одновременного доступа к часто используемым документам с неограниченного числа рабочих мест.

Вывод оригиналов из обращения дает возможность сократить расходы на хранение архива, выведя архив из центрального офиса (например, в удаленный филиал, в коммерческий архив, сдав документы в государственный или муниципальный архив на депозитарное хранение и т. п.).

2. В каком виде сохранять? Если с форматом сохранения файлов документов теперь есть определенность – это формат PDF, то с разрешением и глубиной цветности необходимо решать индивидуально. В большинстве случаев электронный архив – это электронные копии документов, существующих в традиционном виде на бумаге. В этом случае электронный архив фактически выполняет роль научно-справочного аппарата и электронные копии оригинала могут сохраняться в черно-белом формате, что кардинально снижает размер архива. Однако важно, чтобы программное обеспечение максимально «вытягивало» качество итогового изображения, не допуская утери информации, например, штампов, резолюций и т. п. Чтобы этого избежать, иногда копии документов сохраняют в режиме оттенков серого (256 оттенков, или 8 (10)-бит на точку). Стандартно используется разрешение сканирования 300 dpi, для мелких текстов и документов, распечатанных с уменьшением (2 страницы на лист) – 400 dpi (точек на дюйм).

Решение о создании полноцветных копий (24-бит) позволяет получить страховые копии, максимально приближенные к оригиналу. В этом случае для стандартных текстовых документов, напечатанных 14 или 12 кеглем, также может использоваться разрешение сканирования 300 dpi. Для большинства документов, содержащих рукописные пометы, резолюции, какие-то особенности оформления, используют разрешение сканирования 400 dpi, для документов, набранных мелким шрифтом или распечатанных с уменьшением, – 600 dpi. Понятно, что полноцветное сканирование существенно увеличивает размер занимаемого архивом пространства в дисковой подсистеме. Увеличение разрешения сканирования, как и увеличение глубины цветности, существенно увеличивает размер итогового файла.

Создание страховых копий архивных документов не дает права организациям выделять оригиналы к уничтожению до истечения установленных сроков их хранения. При этом никакого редактирования полученного изображения, например, обрезки черных полей, не производится.

3. Обработка отсканированных документов. Индексация и распознавание.

Самый простой вариант – это сохранение архивных дел как графических элементов (картинок). Он требует минимальных трудозатрат, но и существенно ограничивает возможности поиска и использования документов. Второй по сложности вариант – это сканирование архивных дел с заведением регистрационной карточки на каждый документ. Эта работа требует гораздо больших трудозатрат, но и существенно расширяет возможности по поиску конкретных документов, существенно повышает эффективность использования архива. Следующий по трудоемкости вариант – это распознание текста сканируемых документов для целей полнотекстового поиска и сохранение как изображения документа, так и (отдельным слоем позади изображения) результатов распознавания. Обычно исходят из того, что распознавание осуществляется преимущественно для целей полнотекстового поиска, а работа с документом в основном осуществляется именно с его графическим изображением, включающим все элементы оформления, подписи, печати, пометы и т. п. Поэтому, на наш взгляд, полная вычитка результатов распознавания представляется в большинстве случаев нецелесообразной. Как правило, оператор, контролируя результат ввода документа в систему, обращает внимание на то, чтобы не было ошибок в регистрационной карточке на документ, а текст документа содержал небольшое количество ошибок (программы распознавания (OCR) выделяют цветом неуверенно распознанные символы, что позволяет с одного взгляда оценить качество распознавания страницы документа. В дальнейшем в случае необходимости наличие графического образа документа позволяет вычитать и пересохранить конкретный документ.

Если количество ошибочно распознанных символов превышает определенный уровень, документ направляется на повторное сканирование, на выделенный для этих целей планшетный сканер с хорошей оптической плотностью (желательно выше 3D). Чтобы минимизировать ручную работу, часто используют программное обеспечение, автоматически «вытягивающее» качество картинки.

4. Архивное хранение документов в электронной форме.

Правила предусматривают, что каждый электронный документ в архиве должен храниться в двух экземплярах. Фактически каждый документ хранится в четырех экземплярах – один рабочий экземпляр находится в корпоративной информационной системе, второй – в виде резервной копии (backup), которую IT-служба должна регулярно делать для восстановления системы в случае сбоя. И два архивных экземпляра – в виде записанных на компакт-диски с однократной записью5 документов, выгруженных в виде архивного контейнера. Контейнер – zip-папка, содержащая файл или файлы документа, xml-файл с информацией о документе (выгруженной регистрационной карточкой) и, при наличии, файл электронной подписи. Документы выгружаются в виде структуры папок, соответствующие архивным делам с именами папок и zip-файлов в соответствии с архивными правилами. Все файлы и папки записываются в несжатом виде. Используются однослойные оптические диски, рекомендованные производителем для архивного хранения. Документы пишутся на два дублирующих друг друга оптических диска, желательно разных производителей или из разных партий.

5. Экспертиза ценности и передача на государственное хранение.

В настоящее время при определении сроков хранения документов в электронной форме используются перечни, устанавливающие сроки хранения традиционных документов6. В соответствии со ст. 17 Федерального закона «Об архивном деле в Российской Федерации» от 22.10.2004 № 125-ФЗ (ред. от 28.11.2015), организации всех форм собственности обязаны обеспечивать сохранность своих документов в течение сроков, установленных перечнями. Соответственно, по истечении установленных сроков обязательного хранения документы после утверждения соответствующих годовых разделов описей дел постоянного и долговременного хранения (по личному составу) могут быть выделены к уничтожению на основании актов установленной формы. Для этого используется поле регистрационной карточки документа «номер дела по номенклатуре», содержащее срок хранения по Перечню. Соответственно, отнесение документа к тому или иному делу (физическому или виртуальному) в соответствии с номенклатурой дел предварительно определяет срок хранения и учитывается при создании резервных копий документов на носителях с однократной записью (на один носитель записываются документы одного срока хранения).

В то же время следует отметить, что современные информационные системы без проблем поддерживают работу с миллионами документов, значительная часть затрат – это затраты на ввод документов в систему. Исходя из этого экспертная комиссия, проанализировав состав документов, имеет право продлить сроки хранения документов в электронной форме как информационно-справочного массива.

При передаче документов на государственное хранение важно обеспечить выгрузку соответствующего годового раздела из ведомственной системы с возможностью загрузки сведений о передаваемых документах в программный комплекс «Архивный фонд» соответствующего государственного или муниципального архива.

К сожалению, Правила содержат требование о наличии одного экземпляра описей в электронной форме, но не содержат описания формата выгрузки данных. В то же время, учитывая ежегодные значительные затраты на оцифровку уже имеющихся в федеральных, государственных и муниципальных архивах описей и наполнение ПК «Архивный фонд» с целью создания единой системы учета документов Архивного фонда РФ в виде иерархической системы ПК «Архивный фонд» – «Фондовый каталог» – «Центральный фондовый каталог», представляется крайне важным обеспечить передачу сведений о передаваемых документах, чтобы в дальнейшем исключить затраты на ввод сведений в государственных и муниципальных архивах.

О перспективах создания архива юридически значимых электронных документов.

В соответствии с текущим законодательством юридически значимый электронный документ – это документ, подписанный усиленной квалифицированной электронной подписью. Однако используемые в подписи криптографические технологии имеют такой показатель, как криптостойкость, т. е. в течение какого времени мы можем гарантировать подлинность документа. Кроме того, при архивном хранении для обеспечения пригодности электронного документа к использованию может потребоваться его конвертация, т. е. преобразование в формат, доступный для использования на современных компьютерах. А любое изменение файлов документа автоматически аннулирует электронную подпись.

Распоряжение Правительства РФ от 11.06.2013 № 953-р «Об утверждении плана мероприятий («дорожной карты») «Повышение качества регуляторной среды для бизнеса» как раз первоначально предусматривало «Внесение изменений в законодательство Российской Федерации, предусматривающих возможность архивирования документов, обязательных для сохранения на длительный срок, в электронном виде (в том числе электронных образов документов, скрепленных электронной подписью)».

Решение видится в передаче архивам права самостоятельно, за счет внутренних регламентов хранения электронных документов, гарантировать их юридическую значимость, заверяя выдаваемые копии архивных документов электронной подписью архива либо уполномоченного сотрудника архива.

Одновременно необходимо решать вопрос о создании Центра хранения электронных документов как федерального архива, который обеспечивал бы хранение документов в электронной форме в масштабах страны, так как создание во всех государственных и муниципальных архивах условий для приема документов в электронной форме – задача еще более затратная как с точки зрения аппаратных средств, так и с точки зрения необходимости штата квалифицированного IT-персонала, обеспечивающего сохранность, использование, защиту электронных документов от изменений и несанкционированного доступа.

Создание ЦХЭД требует внесений изменений в законодательство и с точки зрения решения вопросов собственности субъектов федерации и муниципальной собственности на архивные документы. Централизованное хранение должно осуществляться на депозитарной основе, тем более что оно должно сопровождаться существенным сокращением сроков передачи документов из организаций в ЦХЭД. С одной стороны, выгрузка годового раздела документов в электронной форме на государственное хранение не приводит к удалению документов из ведомственной информационной системы, а с другой – наличие экземпляра документов на государственном хранении – это не только обеспечение юридической значимости документов, но, что немаловажно, обеспечение их сохранности.

Как мы видим, работы впереди еще очень много, а пока мы можем создавать, хранить и передавать без вывода на бумагу только документы временного срока хранения, главным образом переписку, проекты документов. Документы же постоянного и долговременного срока хранения, составляющие обычно не более 5-10% от общего количества документов, обязательно должны дублироваться на бумаге для целей архивного хранения.


1 С автором можно связаться по адресу: kouznets@yandex.ru

2 Постановление Правительства РФ от 06.09.2012 № 890 «О мерах по совершенствованию электронного документооборота в органах государственной власти» (ред. от 21.07.2014).

3 Постановление Правительства РФ от 25.12.2014 № 1494, Распоряжение Правительства РФ от 02.04.2015 № 583-р, ГОСТ Р 53898-2013 «Системы электронного документооборота. Взаимодействие систем управления документами. Требования к электронному сообщению».

4 «Правила организации хранения, комплектования, учета и использования документов Архивного фонда Российской Федерации и других архивных документов в органах государственной власти, органах местного самоуправления и организациях», утв. Приказом Минкультуры России от 31.03.2015 № 526, зарегистрировано в Минюсте России 07.09.2015 № 38830.

5 См. подготовленные РГАНТД «Рекомендации по обеспечению сохранности информации, записанной на оптических дисках» (опубликованы на сайте Росархива, http://archives.ru/documents/rekomendacii-po-obespecheniju-sohrannosti-informaci-na-diskah.shtml )

6 В первую очередь это «Перечень типовых управленческих архивных документов, образующихся в процессе деятельности государственных органов, органов местного самоуправления и организаций, с указанием сроков хранения», утв. приказом Министерства культуры РФ от 25.08.2010 № 558.