Smart Engines Технология распознавания документов в видеопотоке

Продукт
Название базовой системы (платформы): Искусственный интеллект (ИИ, Artificial intelligence, AI)
Разработчики: Smart Engines (Смарт Энджинс)
Дата премьеры системы: 2023/06/16
Технологии: СЭД - Системы потокового распознавания

Основная статья: OCR - Optical Character Recognition

2023: Получение патента США

Ученые московской компании Smart Engines запатентовали в США один из ключевых компонентов технологии распознавания документов в смартфоне через видео камеру. Это разработка, лежащая в основе линейки программных продуктов Smart Engines, внедренных международными и российскими компаниями, включая девять из 13 системно значимых банков России. Об этом 16 июня 2023 года сообщили представители Smart Engines.

Технология распознавания документов в видеопотоке

По информации компании, в отличие от сканеров, использующихся в системах распознавания предыдущих поколений, смартфоны позволяют использовать для распознавания видеопоток. В этом случае в систему распознавания на входе поступает целая серия изображений объекта различного качества, в том числе, с бликами, в необычных ракурсах или даже в темноте.

Для решения задачи мобильного распознавания авторы патента – научный сотрудник-программист Ольга Петрова, старший научный сотрудник-программист к.т.н. Константин Булатов и генеральный директор Smart Engines к.т.н. Владимир Арлазаров – предложили предварительно оценивать пригодность поступающих кадров для распознавания, и для наилучших кадров совместно использовать результаты их обработки. Это позволяет существенно оптимизировать качество распознавания документа. Такой способ они назвали методом взвешенной Витрина данных НОТА ВИЗОР для налогового мониторинга 2.1 т интеграции.

Как следует из описания патента №11640720 от 2 мая 2023 года, ученые Smart Engines предложили использовать 50% лучших кадров с учетом точности фокусировки изображения и оценки результатов распознавания и назначать каждому символу "вес", опираясь на эти критерии. Например, если часть поля перекрыта пальцем или бликом, то вес символа будет стремиться к нулю, а если символ видно четко – его "стоимость" будет приближена к 1. После назначения весов итоговый результат анализа видеопотока реконструируется при помощи предложенного исследователями алгоритма.

«
Метод посимвольного взвешивания с оценкой фокусировки позволяет оптимизировать качество распознавания в тех случаях, когда удостоверяющий документ снят в неидеальных условиях – под углом, в темноте, с бликами. Посимвольное взвешивание также положительно влияет на результат распознавания, если в документе присутствуют длинные непрерывные строки – скажем, машиночитаемая зона.

отметил Владимир Арлазаров
»

Этот патент стал четвертым изобретением, полученным учеными Smart Engines в США, и третий подряд патент компании, зарегистрированный Штатами в 2023 г.

«
Патент на технологию распознавания документов в видеопотоке стал нашим третьим изобретением, которое регистрируется в Штатах в 2023 году. Конечно, в связи с напряженной международной обстановкой, мы столкнулись с различными сложностями в процессе регистрации изобретений.

рассказал Владимир Арлазаров
»

Метод взвешенной интеграции при распознавании текста в видеопотоке был разработан учеными Smart Engines еще в 2015 году. Он лег в основу программных продуктов Smart ID Engine (распознавание и проверка подлинности паспорта РФ), Smart Code Engine (распознавание QR-кодов, банковских карт, номеров телефонов и номеров банковских карт), Smart Document Engine (распознавание корпоративных документов). Все программные продукты Smart Engines внесены в реестр российских программ. Компания Smart Engines реализует их в России, США и других странах. Только в 2022 году защищенная патентом технология принесла Smart Engines более 400 млн рублей выручки.

Технологии Smart Engines также защищены патентами в России. Сотрудники Smart Engines зарегистрировали девять патентов РФ и 40 полезных моделей. По данным на июнь 2023 года по числу "цифровых" патентов Smart Engines находится на седьмом месте среди российских ИТ-компаний.



СМ. ТАКЖЕ (1)


Подрядчики-лидеры по количеству проектов

За всю историю
2021 год
2022 год
2023 год
Текущий год

  ЭЛАР (Электронный архив, НПО Опыт) (242)
  Directum (Директум) (132)
  Smart Engines (Смарт Энджинс) (123)
  Cognitive Technologies (Когнитивные технологии) (91)
  Синтеллект (Syntellect) (78)
  Другие (746)

  Синтеллект (Syntellect) (52)
  Smart Engines (Смарт Энджинс) (14)
  ЭЛАР (Электронный архив, НПО Опыт) (10)
  Directum (Директум) (5)
  Abbyy Россия (4)
  Другие (32)

  ЭЛАР (Электронный архив, НПО Опыт) (10)
  Beorg (Биорг) (8)
  Smart Engines (Смарт Энджинс) (7)
  NVI Solutions (Норд Вижен Интелледженс Солюшенс) (3)
  Digital Design (Диджитал Дизайн) (2)
  Другие (19)

  Smart Engines (Смарт Энджинс) (21)
  ЭЛАР (Электронный архив, НПО Опыт) (13)
  Синтеллект (Syntellect) (5)
  Beorg (Биорг) (4)
  Digital Design (Диджитал Дизайн) (4)
  Другие (13)

  Smart Engines (Смарт Энджинс) (16)
  ЭЛАР (Электронный архив, НПО Опыт) (9)
  Beorg (Биорг) (2)
  Digital Design (Диджитал Дизайн) (2)
  Content AI (Контент ИИ) (1)
  Другие (6)

Распределение вендоров по количеству проектов внедрений (систем, проектов) с учётом партнёров

За всю историю
2021 год
2022 год
2023 год
Текущий год

  ЭЛАР (Электронный архив, НПО Опыт) (11, 243)
  Directum (Директум) (6, 161)
  Smart Engines (Смарт Энджинс) (17, 130)
  Abbyy Россия (16, 111)
  Cognitive Technologies (Когнитивные технологии) (5, 96)
  Другие (171, 622)

  Синтеллект (Syntellect) (2, 52)
  Smart Engines (Смарт Энджинс) (2, 14)
  ЭЛАР (Электронный архив, НПО Опыт) (3, 8)
  Abbyy Россия (2, 7)
  Directum (Директум) (3, 6)
  Другие (16, 19)

  Smart Engines (Смарт Энджинс) (3, 11)
  ЭЛАР (Электронный архив, НПО Опыт) (3, 10)
  Beorg (Биорг) (1, 8)
  Directum (Директум) (3, 4)
  Digital Design (Диджитал Дизайн) (3, 2)
  Другие (10, 11)

  Smart Engines (Смарт Энджинс) (2, 22)
  ЭЛАР (Электронный архив, НПО Опыт) (4, 13)
  Синтеллект (Syntellect) (2, 5)
  Digital Design (Диджитал Дизайн) (2, 4)
  Beorg (Биорг) (1, 4)
  Другие (8, 10)

  Smart Engines (Смарт Энджинс) (3, 16)
  ЭЛАР (Электронный архив, НПО Опыт) (4, 9)
  Digital Design (Диджитал Дизайн) (2, 2)
  Beorg (Биорг) (1, 2)
  Content AI (Контент ИИ) (1, 2)
  Другие (5, 5)

Распределение систем по количеству проектов, не включая партнерские решения

За всю историю
2021 год
2022 год
2023 год
Текущий год

  ЭЛАР ПланСкан - 151
  Synerdocs - 130
  Smart ID Engine (ранее Smart IDReader) - 113
  ABBYY FlexiCapture - 90
  Е1 Евфрат - 87
  Другие 777

  Syntellect Tessa Мобильное согласование - 30
  Syntellect Tessa Графический визуализатор процессов - 28
  Smart ID Engine (ранее Smart IDReader) - 12
  ABBYY FlexiCapture - 6
  ЭЛАР ПланСкан - 6
  Другие 28

  Smart ID Engine (ранее Smart IDReader) - 10
  ЭЛАР ПланСкан - 9
  Beorg Smart Vision - 8
  Directum Jazz - 2
  EasyData: EasySeparate - 2
  Другие 16

  Smart ID Engine (ранее Smart IDReader) - 18
  ЭЛАР ПланСкан - 8
  Smart Code Engine (ранее Smart CardReader, Smart BarcodeReader и Smart MRZReader) - 4
  Syntellect Tessa Графический визуализатор процессов - 4
  Beorg Smart Vision - 4
  Другие 19

  Smart ID Engine (ранее Smart IDReader) - 12
  ЭЛАР ПланСкан - 5
  Smart Code Engine (ранее Smart CardReader, Smart BarcodeReader и Smart MRZReader) - 4
  ContentReader Server - 2
  ЭЛАР СканИмидж - 2
  Другие 11