2024/02/06 17:30:53

Олег Бейлезон, SL Soft: Электронные хранилища данных (ЭХД) — новое применение ECM

Для создания централизованного хранилища в крупных компаниях необходимо аккумулировать все накопленные данные, которые могут исчисляться сотнями миллионов документов, обеспечивая при этом распределенность, управление сроками хранения и поддержку юридической значимости. С развитием технологий интерес стали вызывать интеллектуальные функции, позволяющие превратить архив контента в источник знаний для анализа и прогнозирования. Подробнее об использовании ECM в качестве электронного хранилища данных рассказал Олег Бейлезон, директор по продуктам SL Soft.

Олег
Бейлезон
«Цитрос Цифровая Платформа» стала разрабатываться несколько лет назад на основе стека открытых технологий.

С какими трудностями сталкиваются крупные компании при организации системы управления и хранения накопленной документации?

Олег Бейлезон: Хранение больших объемов важного контента в неподходящих для этого системах (ERP, BPM, CRM, S3, сетевых папках и т.д.) неизбежно приводит к низкому уровню надежности и безопасности, трудностям с организацией оперативного доступа к файлам в соответствии с ролевой моделью. В каждой используемой системе необходима отдельная реализация механик обработки неструктурированной информации: конвертация, подписание и контроль юридической значимости, дедубликация и т.д. Это приводит к избыточным затратам на разработку и рассинхронизации в функциональной полноте.

К тому же такое хаотическое хранение влечет за собой многократное дублирование информации, то есть нерациональное использование дорогостоящих ресурсов, а также приводит к размытию понятия мастер-копии — неизвестно, насколько актуален и юридически значим тот документ, к которому пользователь получил доступ. Отсутствие единых политик имеет следствием возрастающие риски безвозвратной утери важной информации. Поэтому актуальным стал вопрос контроля долгосрочного хранения в каждой системе — и это тоже ощутимая статья затрат.

Еще одной проблемой, которая была сформулирована в ходе накопления неструктурированной документации, стала малая пригодность ее использования за пределами архивных функций. По сути информация в таких документах постепенно становится мертвым грузом: нет возможности упорядоченного извлечения из нее полезных знаний — атрибутирования, классификации, аналитики и прогнозных исследований и т.д.

Как эти трудности поменяли запросы заказчиков?

Олег Бейлезон: Организации начали обобщать требования к «новому» классу информационных систем, называя их уже известной рынку ранее аббревиатурой ЭХД (электронные хранилища документов), но вкладывая в это понятие смысл, соответствующий современным реалиям.

Во-первых, требуется организация логически единого хранилища всех документов компании, с соблюдением прав доступа на уровне систем-источников, групп пользователей и т.д. Количество документов может исчисляться сотнями миллионов, поэтому необходимы инструменты формирования подборок по требованию, их массовая выгрузка и печать. А это, в свою очередь, невозможно сделать без наличия встроенных средств или тесной интеграции с системами распознавания текста, оцифровки и атрибутирования контента.

Во-вторых, должна быть обеспечена распределенность хранения, оптимизирована его стоимость и использование различных типов хранилищ (файловые, S3-совместимые, облачные). Поэтому нужны развитые средства настройки (предпочтительно low-code), конфигурирования и мониторинга системы, в том числе, крупных и географически распределенных установок. В-третьих, компаниям требуется функциональность по управлению сроками хранения документов и поддержке юридической значимости.

Также важна открытость к интеграции с системами-источниками и системами-потребителями, использование широкого спектра протоколов доступа и инструментарий для миграции контента с других платформ.

Кроме этого, к современным ЭХД выдвигаются требования по «интеллектуализации» деятельности: наличие средств автоматической классификации документов, интеллектуального поиска, умение выявлять факты, строить аналитику и осуществлять прогнозирование на базе извлеченных из контента сведений. Это превращает ЭХД из «сейфа с бумагами» в инструмент, обогащающий организацию новыми, недоступными ранее, данными и способами работы с ними. Безусловно, отказоустойчивость и надежность хранения контента всегда относятся к ключевым требованиям крупных заказчиков.

Чем это отличается от требований к полнофункциональной ECM-системе? Какие решения сейчас используются на российском рынке?

Олег Бейлезон: Специалисты в области ECM, глядя на этот перечень, могут довольно уверенно сказать, что выше были перечислены требования к современным ECM/CSP для крупных организаций. И будут в значительной степени правы! Более того, у наиболее зрелых заказчиков enterprise-сегмента уже несколько лет как стартовали проекты по построению таких ЭХД. Но в силу многолетней опоры российского рынка на зарубежные ECM/CSP-решения (IBM Filenet, EMC Documentum, Opentext, Alfresco и другие) такие проекты, за редким исключением, задумывались и строились на них.

Лишь после того, как иностранные вендоры в сжатые сроки покинули российский рынок, крупные заказчики начали интересоваться, что по этой теме предлагают отечественные производители. Надо сказать, что и российские разработчики за эти годы свыклись с тем, что крупные ECM-проекты забирают зарубежные «тяжеловесы» и больше ориентировался на прикладные ниши либо на закрытие локальный специфических потребностей. Тем не менее, несколько систем, из которых можно делать выбор при проектировании ЭХД для крупных организаций, в России создано и внесено в Реестр отечественного ПО. В их числе — программный продукт «Цитрос Цифровая платформа», разрабатываемый компаний SL Soft.

То есть «Цитрос Цифровая Платформа» может быть основой для построения ЭХД и заместить иностранные решения?

Олег Бейлезон: «Цитрос Цифровая Платформа» стала разрабатываться несколько лет назад на основе стека открытых технологий. Она ориентирована на использование в крупных организациях, то есть на работу с большим числом документов различных форматов и их длительное хранение. Это отразилось в архитектуре системы как на функциональном, так и на техническом уровне.

При ее разработке применены в т.ч. свободно распространяемые библиотеки и модули с открытым кодом, которые не накладывают дополнительных обязательств или ограничений на разработчиков и пользователей.

Компоненты развертывания системы спроектированы таким образом, чтобы дать ей возможность горизонтальной и вертикальной масштабируемости, а также отказоустойчивость. Каждый компонент может быть независимо отмасштабирован и, при необходимости, развернут в отказоустойчивой кластерной конфигурации, в том числе географически распределенной. Платформа уверенно обрабатывает запросы от тысяч одновременных пользователей и содержит сотни миллионов документов. Контент может располагаться в программных, аппаратных сетевых и программно-определяемых хранилищах (последние работают по протоколу S3, в том числе, разворачиваются в облаках).

Функционируя в роли ЭХД, «Цитрос Цифровая Платформа» аккумулирует документы, поступающие через различные информационные системы организации, а также с линий сканирования и оцифровки и из других электронных каналов (почта, внешние порталы и т.д.). Документы содержатся в соответствии с централизованными политиками хранения, безопасности и управления юридической значимости. Решение тесно интегрируется в информационный ландшафт организации, предоставляя широкий выбор протоколов и инструментов для приема и передачи контента, обмена идентификационной и авторизационной информацией.

Российское законодательство регламентирует хранение документов, насколько «Цитрос Цифровая Платформа» отвечает этим требованиям?

Олег Бейлезон: Мы внимательно следим за изменениями в законодательстве и оперативно дорабатываем наше решение. Долговременное хранение осуществляется с обеспечением юридической значимости благодаря функции переподписания электронных документов.

Электронная номенклатура позволяет определять документы в дела и управлять ими в соответствии с нормативными требованиями в области оперативного и архивного хранения. Подборки, массовая выгрузка и печать предназначаются для случаев истребования у организации единовременно большого количества документов, например, по запросу проверяющих госорганов.

Встроенный топографический указатель помогает осуществлять навигацию по хранилищам бумажных документов, если они еще не переведены в электронный вид, либо если законодательством предусмотрена необходимость хранения бумажных оригиналов.

Вы говорили о существовании запроса на интеллектуальные функции. Как они реализованы в «Цитрос Цифровой Платформе»?

Олег Бейлезон: Интеграция с экосистемой продуктов SL Soft обеспечивает «Цитрос Цифровую Платформу» интеллектуальными функциями, обогащающими неструктурированные данные как машиночитаемой, так и доступной человеку информацией, а также снижающие долю ручного труда и необходимость принятия решений человеком при обработке документации.

Автоматические классификаторы определяют принадлежность документа к тем или иным типам на основании его текстового содержимого.

Экстракторы объектов позволяют извлечь ценные сведения о персоналиях, товарах, городах и других важных фактах, и поместить их в атрибуты либо передать во внешние системы. Кроме этого, из документов могут быть автоматически выделены и проанализированы графические объекты (лица, печати).

Встроенные рекомендательные сервисы предлагают маршруты обработки документа исходя из его состава и накопленного опыта. Есть и интеллектуальный поиск — он уточняет и дополняет запросы пользователей и выдает максимально точные подборки. Отдельного внимания заслуживает подсистема правовой экспертизы, которая сопоставляет документы с государственными или локальными актами и выявляет противоречия с действующим законодательством или нормативной базой организации.

Недавно реализована функция построения дашбордов для представления извлеченной информации в удобном для анализа виде, что дает возможность прецизионной работы с данными и извлечения ценных фактов и инсайтов.

Насколько сложно внедрить ЭХД?

Олег Бейлезон: Для того, чтобы функциональность ЭХД соответствовала запросам, важно выбрать систему, которая с момента своего проектирования ориентировалась на решение серьезных ECM-задач. Также необходимо понимать, что вопросы такого рода — масштабные, затрагивающие все подразделения организации и слои ИТ-ландшафта. И, несмотря на наличие в ECM/CSP-платформах, таких как «Цитрос Цифровая Платформа», инструментария для облегчения внедрения (механизмов миграции документов, средств централизованного управления конфигурацией и мониторинга работы систем), а у компаний-внедренцев — опыта и методологии, каждый подобный проект особенный и требует серьезного внимания и со стороны бизнес- и ИТ-подразделений заказчика и существенной поддержки от топ-менеджмента. Иначе может «не взлететь».