Большие данные: первые итоги
Big data, data mining – все эти новые технологии для работы с данными находятся на «передовой» рынка BI-систем. Но готовы ли к ним российские компании, в каких отраслях они используются и могут ли быть полезны? Остается ли «продвинутая» аналитика доступной только банкам или телеком-операторам? Где еще могут быть использованы современные инструменты бизнес-анализа? Обо всем этом TAdviser рассказала Ольга Горчинская, руководитель направления BI & Big data компании «ФОРС».
Каталог BI-решений и проектов доступен на TAdviser
Ольга Горчинская: Да, определенная активность в отношении big data, in-memory computing (вычислений в оперативной памяти) и сопутствующих технологий на рынке есть, но все-таки у меня сложилось впечатление, что интерес заказчиков к таким технологиям и инструментам пока находится на уровне экспериментов. Даже в банковской сфере и телекоме, где с большими данными уже начали работать, речь идет, как правило, о стадии, предшествующей промышленному внедрению.
То есть говорить о массовом коммерческом спросе на такие технологии пока не приходится, зато проводится множество исследовательских проектов, причем не только при участии системных интеграторов, но и силами внутренних ИТ-команд заказчиков. Например, оператор «Вымпелком» во многих своих новых ИТ-проектах использует инструменты повышения производительности, связанные с большими данными, в т.ч. Hadoop и NoSQL базы данных, и получает отличные результаты. В «Сбербанке» проводятся пилотные проекты для оценки преимуществ, которые могут дать большие данные. Но реальное развертывание таких инструментов пока только в планах. Есть и исключения на рынке, когда компании действительно используют всю мощь big data, например, это банк «Тинькофф Кредитные Системы». Понятно, что такие проекты на слуху у всего рынка.
TAdviser: Если говорить об анализе больших данных, правильно ли мы понимаем, что в первую очередь им заинтересовались финансовые институты, банки?
Ольга Горчинская: Да, это так, потому что компании этих отраслей наиболее зрелы в анализе данных. Большинство из них уже внедрило стандартные BI-инструменты и даже углубленную аналитику. Например, практически во всех крупных банках внедрены не только инструменты для интерактивного анализа и построения информационных панелей, но и используются математические и статистические методы в отделах управления рисками, поэтому вполне естественно двигаться дальше в направлении освоения новых аналитических средств. При этом нельзя сказать, что большие данные нужно использовать исключительно для новых бизнес-задач. Очень часто они позволяют взглянуть по-новому на уже существующие задачи, предложить их новую трактовку и способы решения. Михаил Садиров, SMART technologies: На тестирование мультивендорных решений есть спрос
Например, в кредитных отделах банков традиционно проводится оценка профилей клиентов, их надежности, платежеспособности (кредит-скорринг), в том числе средствами data mining. Использование больших данных, например, позволяет добавить этой задаче новую грань за счет расширения состава данных о клиентах, которые можно получить из социальных сетей. Подобные проекты идут сейчас в нескольких банках, например, в Хоум Кредите, Тинькофф Кредитные системы, Сбербанке.
Разумеется, потенциально очень серьезный спрос на big data и углубленную аналитику ожидается и в госсекторе, но здесь инициативы реализуются более медленно. Технологии больших данных, вычислений в оперативной памяти в государственных организациях будут востребованы еще и потому, что там как нигде много работают с неструктурированной информацией. У «ФОРС» очень много заказчиков в госсекторе. Я могу привести в пример проект в Фонде обязательного медицинского страхования (ФОМС), где мы сейчас внедряем технологии in-memory и углубленную аналитику, модернизируя существующую аналитическую систему. На госсектор приходится более половины выручки ФОРС от направления BI, и мы ожидаем, что эта пропорция сохранится.
'TAdviser: ФОРС по части экспертизы в области бизнес-аналитики опирается на линейку Oracle, это целый спектр продуктов, причем не только программных, но и программно-аппаратных. В том числе это специализированные системы для планирования и бюджетирования. Скажите, пожалуйста, насколько востребовано это направление? Как оно вообще развивается?
Ольга Горчинская: Системы по бюджетированию и планированию Oracle входят в блок BPM/EPM (управление эффективностью деятельности предприятия), куда также относятся и решения для консолидации отчетности и стратегического планирования. Самые популярные из них это, конечно, системы планирования и бюджетирования. Мы отмечаем стабильный интерес к системам класса BPM. Это очень понятные решения для заказчиков, эффект от внедрения которых легко оценивается даже количественно. Если эффект от внедрения BI может быть отложенным, долгосрочным, трудно выразимым в виде каких-то конкретных показателей, то с BPM все просто: например, в несколько раз сокращается цикл планирования, а это уже очень существенный экономический эффект.
Поэтому этот класс систем и привлекает такое внимание. Планирование и бюджетирование в большинстве компаний так или иначе ведется, хотя бы на уровне Microsoft Excel, а EPM-платформы наподобие Oracle Hyperion Planning – это уже следующий, более серьезный уровень. Большинство крупных компаний такие платформы внедрили, сейчас мы отмечаем интерес к ним со стороны среднего бизнеса, причем не только в России, но и в СНГ, где мы тоже ведем проекты. Нередко такие проекты получают дополнительное развитие, так как в крупных организациях в EPM-системах работает много пользователей, используются очень сложные модели бюджетирования, и производительность становится большой проблемой. В этом случае требуются дополнительные решения такие, как, например, технологии in-memory analytics от компании Oracle, встроенные в программно-аппаратный комплекс Oracle Exalytics. У ФОРС сильная команда по внедрению Oracle EPM, в том числе и по направлению повышения производительности существующих систем, мы развиваем эту экспертизу очень активно.
TAdviser: Эксперты Gartner говорят, что один из важных трендов BI на ближайшие годы - это развитие аналитических платформ, в том числе в части интерфейсов, в пользу такого user-friendly, дружелюбия к конечным пользователям, которым предлагаются инструменты для легкого серфинга данных, в том числе неструктурированного типа, составления самостоятельных запросов. Oracle предлагает какие-то решения такого плана? Доступны и внедряются ли они в России?
Ольга Горчинская: Как только BI-системы появились как класс, эксперты сразу начали говорить о том, что они должны быть очень дружелюбны к пользователям: все инструменты, средства составления запросов должны быть просты и понятны, а идеальная система должна позволять бизнес-пользователям формулировать их самостоятельно. На самом деле, все современные BI-платформы уже очень близко подошли к реализации этой концепции. Кроме этого, во многом изменились и сами бизнес-пользователи. Тот абстрактный менеджер, на которого рассчитан интерфейс бизнес-аналитики, сегодня уже опытный интернет-серфер, который с легкостью умеет формулировать запросы к поисковым веб-машинам, находить нужное в сети, разбираться в интерфейсах новых и не всегда удачно скроенных сайтов.
Поэтому, на мой взгляд, сейчас важна не столько простота интерфейса, сколько понимание пользователем, что же именно ему было бы важно знать, и, конечно, его мотивация к поиску и анализу. Поэтому BI-вендоры работают над поддержкой возможностей «активной аналитики» и интуитивного поиска и многие уже предоставляют такие средства. Приведу пример: допустим, в компании упала прибыль, что именно руководитель должен найти в аналитической системе, чтобы понять причину этого? В современные BI-платформы, в том числе в Oracle BI, «зашито» множество готовых сценариев на такой случай. Например, нажав на цифру прибыли, руководитель тут же получит две новых - складские остатки и количество новых заявок от клиентов и сможет их сопоставить. Ситуация ведь может состоять не только в недостатке спроса, но и недостатке продукции, чтобы его удовлетворить. Система автоматически выдает информацию, которая не является ответом на четко сформулированный вопрос, а, скорее, помогает понять причину того или иного события.
TAdviser: Но большие данные – это такой массив информации, где мы заранее не знаем ни его структуру, ни атрибуты будущего поиска?
Ольга Горчинская: Примерно так. Здесь совершенно иной подход, ведь работая с такими массивами информации, мы часто не совсем точно понимаем, что именно окажется полезным для решения бизнес-задачи. Именно здесь очень востребованы возможности интуитивного поиска и анализа, которые могут подтолкнуть к формированию у пользователя новых гипотез, позволить быстро их проверить, в результате чего постепенно становится понятным, как решить существующую бизнес проблему. Такие продукты на рынке появляются, например - Oracle Endeca. Это решение уже доступно в России, и мы делаем различные демонстрационные индустриальные решения на основе этой платформы, интегрируя ее с инструментами статистических исследований, data mining и средствами лингвистической обработки текстов.
У нас есть большой и очень интересный проект для компании «РОСЭКО», члена Российского общества оценщиков (РОО), где анализ больших данных о стоимости недвижимости, взятых из интернета, позволил построить очень точную, привязанную к географической карте модель оценки объектов недвижимости, в том числе для государственных нужд, которая в дальнейшем может быть использована по всей России уже в «облаке». Это решение работает на Oracle Endeca, в проекте также задействована инструментальная среда статистических исследований Oracle R Enterprise и лингвистические продукты компании RCO.
TAdviser: Давайте развеем миф о том, что «тяжелая» артиллерия BI нужна только банкам, телекому, ритейлу. ФОРС, например, предлагает аналитические решения в том числе для спортивных (!) организаций. Чем еще вы можете нас удивить?
Ольга Горчинская: Бизнес-анализ нужен, разумеется, не только крупным компаниям, но и среднему бизнесу вплоть до малого и даже индивидуальным предпринимателям. Банки, ритейл, телеком традиционно в авангарде BI-автоматизации, их к этому подталкивает и конкуренция, и большие возможности для инвестиций в ИТ, но все остальные отрасли также двигаются в этом направлении. BI-решения могут представлять собой и мощные платформы, и небольшие узко-заточенные системы для конкретных задач. ФОРС, конечно, интересно двигаться не только по проторенной дороге, но и постоянно делать что-то новое.
Для нас такой новой областью стала аналитика для спортивных клубов, в первую очередь футбольных, но и не только. Автоматизацией спортивных организаций мы занялись уже давно – одними из первых на рынке. У нас есть собственная специализированная система SmartSport, разработанная с учетом специфики деятельности спортивных клубов, и она, кстати, включает и аналитический модуль для мониторинга показателей эффективности деятельности клуба, а также для анализа результативности команд, игроков и матчей. Отдельно мы работаем над развитием системы «Кристалл», которая будет поставляться как в рамках SmartSport, так и в виде самостоятельного продукта. Это очень интересное, ориентированное на психологов клубов решение для проведения самых различных психологических тестов, анализа психометрических данных игроков, оценки совместимости игроков в команде, исследования динамики изменения характеристик игроков во времени и др.
Еще одно перспективное направление для клубов – анализ больших данных из социальных сетей. Здесь можно анализировать поведение игроков, в том числе потенциальных, за пределами клуба, на предмет соблюдения ими режима и спортивной дисциплины или, например, пытаться контролировать фанатское движение, своевременно применять меры в связи с какими-то противоправными акциями.
TAdviser: Сегодня развитие большинства ИТ-платформ, будь то ERP, CRM и или BI, находится под влиянием такого существенного тренда как social. То есть все больше элементов социальных сетей или структурных принципов социальных сетей проникает в деловое ПО. Как это находит отражение в тех продуктах, с которыми вы работаете?
Ольга Горчинская: Мы уже затронули тему социальных сетей. Большая часть задач, которой сейчас интересуются в области больших данных, это именно анализ социальных сетей. Он необходим, например, банкам для оценки рисков, особенно в сфере массового кредитования, для более эффективного продвижения продуктов и услуг, для повышения прибыльности клиентов. При этом простота извлечения информации из социальных сетей только кажущаяся: не все данные открыты, требуются специальные интерфейсы и шлюзы для сбора этих данных из различных информационных ресурсов. Именно поэтому мы сейчас развиваем сотрудничество с компаниями, которые разрабатывают такие интерфейсы и шлюзы уже десяток лет. Их не так много, мы, например, работаем с компаниями «Аналитические бизнес решения» и «Айкумен», имеющими большой опыт внедрения подобных решений для служб безопасности различных организаций, аналитических служб государственных и коммерческих компаний. Такое сотрудничество нам видится более эффективным, чем попытки «изобрести велосипед».
TAdviser: Как вы оцениваете уровень проникновения технологий data mining на наш рынок? Есть ли к ним интерес со стороны заказчиков, какие-то конкретные наработки?
Ольга Горчинская: К data mining интерес на российском рынке существует уже много лет, но пока до активных внедрений, как правило, не доходит. За пределами банковской сферы, где data mining используют отделы управления рисками и кредит-скоринга, больших продвижений в этом направлении немного. Определенная заинтересованность есть в ритейле, но здесь, как правило, речь идет о пилотных внедрениях. Были эксперименты по использованию Oracle Data Mining в универмаге «Детский мир» для задач маркетинга - таких, как реализация целевого товара, повышение лояльности клиентов. По спортивной аналитике мы также работаем в данном направлении.
Тем не менее, на рынке есть оживление, связанное во многом с растущей популярностью языка статистических исследований R, на базе которого Oracle создал продукт R Enterprise. Мы активно используем в наших проектах и этот продукт, и Oracle Data Mining. Эти средства, например, используются в упомянутом проекте «РОСЭКО», где очень много сложной аналитики: кластеризация, самоорганизующиеся карты Кохенена и так далее.
TAdviser: Каким перспективным направлениям BI и Big data ФОРС будет уделять главное внимание в ближайшем будущем?
Ольга Горчинская: Мы продолжаем работать в области углубленной аналитики для решения практических задач с применением статистических и математических методов, а также языка R. Исследуем возможности автоматической обработки текстов для извлечения из неструктурированных текстов полезных фактов и использования их в средствах класса Data Discovery. Готовых продуктов в области лингвистической обработки на рынке пока не так много, притом, что в связи со спецификой русского языка, мы ориентируемся только на отечественные решения. Интересное исследовательское направление представляет собой анализ эмоций (emotional intelligence) для общего анализа данных о человеке, например, оценке его эмоционального отношения к некоторому предмету или теме без использования прямых вопросов и анкет, только на основании специальных средств анализа физиогномики и мимики. Есть специализированные решения, которые долго оставались нишевыми, но в связи с развитием big data у них появились большие перспективы, и мы думаем над тем, где и как они могут быть применены.