Разработчики: | ФИЦ ИУ РАН - Информатика и управление Федеральный исследовательский центр РАН, Центр компетенций НТИ на базе МГУ, Технологии системного анализа |
Дата премьеры системы: | 2020/04/14 |
Технологии: | Big Data, Data Mining |
2020: Разработка решения для интеллектуального анализа больших массивов текстов
В Центре компетенций НТИ на базе МГУ по направлению «Технологии хранения и анализа больших данных» совместно с Институтом проблем искусственного интеллекта ФИЦ «Информатика и управление» РАН и ООО «Технологии системного анализа» разработана платформа текстовой аналитики на основе интеллектуальных систем сбора и обработки текстов на русском и английском языках. Проект является первым в мире промышленным решением, обладающим возможностями кросс-языковой аналитики. Об этом 14 апреля 2020 года сообщил РВК.
Разработанное решение может анализировать и обрабатывать любой тип информации, представленной в текстовом виде на русском, английском, белорусском, казахском и татарском и языках. Преимуществом проекта является возможность кросс-языковой аналитики текстов: не требуется повторный поиск одних и тех же сведений, представленных в документах на разных языках и описанных терминами из разных языков. Внедрение решения существенно упростит работу специалистов, работающих с анализом больших объемов текстов, и значительно повысит эффективность патентного и исследовательского поиска.
Решение позволяет проводить анализ больших объемов научно-технической информации, анализ социальных сетей на предмет выявления материалов нежелательной тематики, девиантного поведения, анализ психологического состояния пользователей и социальной напряженности слоев общества. Кроме того, решение может выполнять задачи по извлечению информации, анализу медицинских документов, технической информации по закупкам для перевода больших полуструктурированных массивов текстов в форму структурированной информации.
В дальнейшем потребителями разработки могут стать аналитические центры, научные и научно-образовательные организации, предприятия, оказывающие услуги защиты интеллектуальной собственности, государственные корпорации. Также потенциальными потребителями могут стать нормативно-правовые справочные системы и консалтинговые бюро.
Симбиоз нескольких научных подходов, предложенный президентом Российской академии социальных наук, доктором философских наук, профессором Г.В. Осиповым, позволяет описывать тематику документов через словосочетания и анализировать смысл, отдельных высказываний в форме неоднородных семантических сетей. В совокупности с современными методами компьютерной лингвистики, дистрибутивной семантики и машинного обучения созданное решение позволяет достигать большей точности и полноты в задачах текстовой аналитики, |
Решение на апрель 2020 года уже прошло стадию пилотных внедрений в таких организациях, как: ИНФРА-М, НЦР Руконт, НТИМИ, Дирекция научно-технических программ, Минобрнауки РФ, что позволило собрать базу технологических запросов заказчиков в области текстовой аналитики.
Стоимость разработки и внедрения готового решения варьируется от 5 до 25 млн рублей в каждом конкретном случае в зависимости от потребности заказчика в услугах по интеграции, кастомизации и глубокой настройке программного обеспечения.
Подрядчики-лидеры по количеству проектов
Loginom Company (ранее BaseGroup Labs Аналитические технологии) (125)
БизнесАвтоматика НПЦ (118)
Инфосистемы Джет (13)
Сбербанк (10)
Полиматика (Polymatica) (9)
Другие (617)
БизнесАвтоматика НПЦ (3)
Ростелеком (3)
IPavlov (Айпавлов) (2)
NLogic (2)
Сапиенс солюшнс (Sapiens solutions) (2)
Другие (48)
БизнесАвтоматика НПЦ (13)
OneFactor (Уанфактор) ЕдиныйФактор (3)
К-Скай (K-SkAI) (2)
HFLabs (ХФ Лабс), ранее HumanFactorLabs (2)
Loginom Company (ранее BaseGroup Labs Аналитические технологии) (2)
Другие (57)
Распределение вендоров по количеству проектов внедрений (систем, проектов) с учётом партнёров
Loginom Company (ранее BaseGroup Labs Аналитические технологии) (2, 236)
БизнесАвтоматика НПЦ (2, 117)
Полиматика (Polymatica) (4, 15)
SL Soft (СЛ Софт) (3, 15)
Oracle (12, 14)
Другие (299, 166)
БизнесАвтоматика НПЦ (1, 3)
Полиматика (Polymatica) (1, 2)
SL Soft (СЛ Софт) (1, 2)
Dell EMC (1, 2)
Minit (1, 1)
Другие (6, 6)
БизнесАвтоматика НПЦ (1, 13)
Сбербанк (2, 2)
К-Скай (K-SkAI) (1, 2)
Мегапьютер Интелидженс (Megaputer Intelligence) (1, 2)
Loginom Company (ранее BaseGroup Labs Аналитические технологии) (1, 2)
Другие (14, 16)
БизнесАвтоматика НПЦ (1, 7)
Сбербанк (2, 2)
Ситроникс КТ (ранее Кронштадт Технологии) (2, 2)
Группа компаний ЦРТ (Центр речевых технологий) (1, 2)
Полиматика (Polymatica) (1, 2)
Другие (13, 16)
SL Soft (СЛ Софт) (3, 4)
Полиматика (Polymatica) (3, 4)
БизнесАвтоматика НПЦ (1, 2)
Rubbles (Раблз) (1, 1)
T1 Digital (Т1 Диджитал) (1, 1)
Другие (6, 6)
Распределение систем по количеству проектов, не включая партнерские решения
Deductor - 226
Visary BI Платформа бизнес-аналитики - 117
Polymatica Analytics Аналитическая платформа - 13
IBM SPSS Decision Management - 10
Loginom Аналитическая платформа - 10
Другие 157
Visary BI Платформа бизнес-аналитики - 3
Polymatica Analytics Аналитическая платформа - 2
EMC Greenplum Data Computing Appliance - 2
Loginom Аналитическая платформа - 1
IBM SPSS Decision Management - 1
Другие 5
Visary BI Платформа бизнес-аналитики - 13
Webiomed - Платформа предиктивной аналитики и управления рисками в здравоохранении на основе машинного обучения - 2
PolyAnalyst Платформа визуальной разработки сценариев анализа данных и текстов - 2
Loginom Аналитическая платформа - 2
Platforma и HFLabs: Технология безопасного метчинга данных - 2
Другие 11
Подрядчики-лидеры по количеству проектов
БизнесАвтоматика НПЦ (118)
Большая Тройка (46)
Умная Логистика (14)
Сбербанк (14)
Доверенная среда (13)
Другие (457)
Доверенная среда (5)
Большая Тройка (4)
Цифра (4)
Ростелеком (3)
БизнесАвтоматика НПЦ (3)
Другие (54)
БизнесАвтоматика НПЦ (13)
РИР (Росатом Инфраструктурные решения) (3)
OneFactor (Уанфактор) ЕдиныйФактор (3)
Сбербанк (2)
Яндекс (Yandex) (2)
Другие (44)
Распределение вендоров по количеству проектов внедрений (систем, проектов) с учётом партнёров
БизнесАвтоматика НПЦ (2, 117)
Большая Тройка (2, 46)
Умная Логистика (2, 14)
Доверенная среда (1, 13)
Цифра (2, 9)
Другие (251, 119)
Доверенная среда (1, 5)
Большая Тройка (2, 4)
Цифра (1, 4)
БизнесАвтоматика НПЦ (1, 3)
Умная Логистика (2, 2)
Другие (6, 8)
БизнесАвтоматика НПЦ (1, 13)
РИР (Росатом Инфраструктурные решения) (2, 3)
Мегапьютер Интелидженс (Megaputer Intelligence) (1, 2)
МегаФон (2, 1)
Netrika (Нетрика) (1, 1)
Другие (6, 6)
БизнесАвтоматика НПЦ (1, 7)
РИР (Росатом Инфраструктурные решения) (3, 4)
Цифра (1, 2)
CM.Expert (АвтоЭксперт) (1, 2)
Датакаталог (1, 2)
Другие (12, 12)
Rocket Group (Рокет Групп) (1, 2)
БизнесАвтоматика НПЦ (1, 2)
СПбГУ ИТМО (Санкт-Петербургский национальный исследовательский университет информационных технологий, механики и оптики) (1, 2)
Цифра (1, 2)
Luxms (1, 1)
Другие (11, 11)
Распределение систем по количеству проектов, не включая партнерские решения
Visary BI Платформа бизнес-аналитики - 117
Большая Тройка: АИС Редактор территориальных схем - 39
Доверенная среда: Триафлай BI-платформа - 13
ZIIoT Платформа для работы с промышленными данными - 9
Luxms BI - 8
Другие 123
Доверенная среда: Триафлай BI-платформа - 5
ZIIoT Платформа для работы с промышленными данными - 4
Visary BI Платформа бизнес-аналитики - 3
Большая Тройка: АСУ Управление отходами - 2
Цифровая Траектория: Action Track (ATC) - 2
Другие 10
Visary BI Платформа бизнес-аналитики - 13
Росатом Цифровое теплоснабжение - 2
PolyAnalyst Платформа визуальной разработки сценариев анализа данных и текстов - 2
N3.Аналитика - 1
МегаФон: Аналитика городской среды - 1
Другие 6