Как защитить деньги, клиентов и репутацию компании с помощью технологий распознавания
Информационная безопасность становится глобальной проблемой крупных компаний. За последний год количество масштабных утечек данных выросло в 8 раз[1]. При этом к злоумышленникам все чаще стали попадать не только тексты, но и изображения документов: договоры, паспорта, кредитки и даже истории болезней пациентов. Как OCR-технологии могут защитить бизнес от подобных угроз? Об этом – в материале TAdviser.
Содержание |
Только за первое полугодие 2017 года произошло 925 масштабных утечек конфиденциальной информации, что на 10% больше, чем за тот же период в 2016 году – такие данные приводят эксперты компании Infowatch. Причем большинство инцидентов (около 56%), в том числе связанных с утечкой изображений, произошли по вине сотрудников компаний. Например, в июле в результате внутренней ошибки австралийская туристическая компания Flight Centre передала паспортные данные сотен своих клиентов посторонним людям. А Шведское транспортное агентство и вовсе случайно отправило e-mail рассылку с базой всех транспортных средств в стране, включая имена и фотографии владельцев автомобилей - даже граждан, которые находятся в программе защиты свидетелей.
Утечки в виде сканированных копий, фотографий и скриншотов с конфиденциальной информацией нередко происходят и в России. Так, по данным Solar Dozor, 31% таких инцидентов в российских компаниях приходится на финансовый сектор, 21% случаев происходит в топливно-энергетическом секторе, 17% утечек приходится на госструктуры и 11% - на ритейл. Около 8% утечек происходит в отраслях машиностроения и ОПК, но именно там специалисты отмечают высокую динамику, - число подобных инцидентов в этих сферах постоянно растет.
Частично причиной таких утечек является конкурентная разведка. Утекают списки клиентов, внутренняя управленческая отчётность и операционные планы. Другая причина - внутреннее мошенничество и использование информации в личных целях. Оценить такой ущерб можно лишь приближенно – и это около 3% от выручки компаний ежегодно, – отмечает Василий Лукиных, менеджер по развитию бизнеса Solar Dozor компании Solar Security. |
По данным исследования компании «СёрчИнформ» 31% российских специалистов по информационной безопасности из крупных российских компаний отметили остроту проблемы утечки данных в виде изображений.Метавселенная ВДНХ
Под угрозой находится более трети данных бизнеса: аналитики «СёрчИнформ» посчитали, что в среднем объем сканированных копий составляет около 30% всех документов. В госсекторе это около 41,5% документов, в ритейле — 17%, в сфере услуг — 23%, а в банках и телеком-сфере приближаются к 45%.
Если злоумышленник имеет доступ к данным, то защитить информацию может только DLP-система, проверяющая все исходящие коммуникации на предмет передачи критичных для бизнеса данных, в том числе на изображениях, - говорит ведущий аналитик «СёрчИнформ» Алексей Парфентьев. |
Технологии распознавания ABBYY в составе DLP-решений
Ведущие российские разработчики DLP утверждают, что для полноценной защиты критически важных активов необходимо применение OCR-технологий. Именно они помогают бизнесу вовремя предотвратить утечку важных документов в виде сканов и фотографий – паспортов, водительских удостоверений и даже чертежей.
Для работы OCR-модуля в DLP критическое значение имеют несколько факторов. Прежде всего, это производительность, точность распознавания, возможности классификации документов и поддержка различных языков. По мнению специалистов по информационной безопасности, преимуществами в этих направлениях обладают технологии ABBYY. Их используют в качестве системы распознавания крупнейшие российские DLP-производители: InfoWatch, Solar Security, SearchInform и Zecurion, общая доля которых превышает 75% рынка DLP (по оценке аналитиков компании Anti-Malware). Кроме того, технологии ABBYY используют в своих решениях компании Falcongaze и Symantec.
При работе с текстами на английском языке технологии ABBYY довольно сильно выигрывают по скорости. С русским языком есть заметный перевес по качеству распознавания, - комментирует Александр Акимов, генеральный директор FalconGaze. |
В результате собственных тестов специалисты «СёрчИнформ» убедились, что OCR-модуль, построенный на базе технологий ABBYY, на 10-12% точнее распознает обычный текст и на 30% лучше обрабатывает сложные изображения. При этом алгоритмы ABBYY используют возможности современных процессоров, и некоторые задачи выполняются в 3-4 раза быстрее стандартного OCR на базе открытых технологий. Также технология ABBYY позволяет производить классификацию документов по внешнему виду, содержанию и другим признакам: выделять в общем потоке документов паспорта, кредитные карты, водительские удостоверения, и так далее.
По данным компании InfoWatch, 90% заказчиков DLP-решения InfoWatch Traffic Monitor применяют технологии распознавания ABBYY, чтобы быстро находить конфиденциальную информацию, передаваемую в виде изображений.
Большую часть задач в DLP решает анализ текста: например, по ключевым словам, с учетом синонимов и различных форм, по фразам, атрибутам или структуре документов. «Если текст в документе распознан некорректно, система может его просто пропустить и не выполнить свою главную функцию, - говорит Андрей Исаев, директор по продуктам группы компаний ABBYY. - И, конечно, для российских заказчиков важна хорошая поддержка кириллицы, так как большинство конфиденциальных данных, подлежащих контролю с помощью DLP-систем, содержатся в документах на русском языке. |
Расследования инцидентов. Как компании предотвратили утечку с помощью OCR ABBYY
Технология оптического распознавания текста ABBYY крайне востребована в компаниях, где чувствительной к утечке информации являются графические файлы, в частности, в дизайнерских и конструкторских бюро, на промышленных предприятиях. Также модуль ABBYY часто используется там, где ведётся работа с отсканированными документами: например, в страховых компаниях и банках. Вместе с ABBYY мы можем предотвращать утечку не только текстовых или графических документов, но и бумажных оцифрованных документов, - отметил Владимир Ульянов, руководитель аналитического центра Zecurion Analytics. |
Как заказчики DLP-решений применяют OCR-модуль на практике? Эксперты ИБ привели ряд примеров. Так, в одной российской компании была неплохо выстроена система безопасности с организационной точки зрения: закрыты все «лишние» каналы связи, запрещены личные устройства, заблокированы выходы в социальные сети и так далее. Доступ к данным был строго регламентирован. Несмотря на предосторожности службы безопасности, один менеджер по продажам, не имея никаких других возможностей, методично наделал скриншотов из CRM и таким образом распечатал базу клиентов. Благодаря применению OCR-модуля на базе технологий ABBYY, при печати первого же скриншота служба безопасности получила оповещение. На пятидесятой странице предупреждение получил начальник отдела безопасности. Конечно, с менеджером расстались, а утечка была предотвращена.
Другой пример относится к строительной компании. При участии в тендере одного из архитекторов подкупили основные конкуренты. Они пообещали ему крупную сумму за то, что он «сольёт» проект для тендера. Ненадежный сотрудник согласился, но, когда он попытался отправить эскизы проекта по электронной почте, OCR-модуль на базе технологий ABBYY преобразовал графический файл и выделил в нем текст, относившийся к конфиденциальным документам. Далее система Zecurion Traffic Control (Zgate) проанализировала его и заблокировала передачу файлов.
Нередко воровство информации относится к персональным данным. Используя DLP «СёрчИнформ» с OCR-модулем на базе технологий ABBYY, сотрудник службы безопасности гостиницы обнаружил, что кто-то отправляет сканы паспортов посетителей на внешнюю почту. Расследование показало, что сотрудница ресепшен продавала их на специализированных сайтах. Так удалось на ранней стадии остановить деятельность мошенницы на рабочем месте.
Конечно, если говорить об утечках, нельзя не упомянуть финансовый сектор. В одном банке служба безопасности обнаружила в черновиках личной почты сотрудника фотографии кредитных карт клиентов. Это стало возможным благодаря тому, что DLP-система «СёрчИнформ» «подтянула» фото, а технологии ABBYY распознали и проанализировали текст, когда специалист зашел на почту с рабочего ПК. Расследование показало, что сотрудник таким образом сливал данные мошенникам, а за «поставку» жертв сотруднику банка полагался процент.
Однако самый неожиданный случай утечки чуть не организовала вполне лояльная сотрудница. Девушка решила похвастаться необычным маникюром в соцсетях и сделала фото «ноготков» на фоне документов, составляющих коммерческую тайну компании. Система Solar Dozor перехватила фотографию, благодаря тому, что OCR-модуль распознал документ на заднем плане, и передача данных была заблокирована.
Подготовлено при поддержке компании ABBYY
236