Типовые блоки современных BI-систем
Основные возможности BI-систем развиваются по четырем основным направлениям: хранение данных, интеграция данных, анализ данных и представление данных.
Каталог BI-решений и проектов доступен на TAdviser.
Содержание |
Хранение данных
Данные, используемые для бизнес-анализа, организуются в специальные хранилища (data warehouse, DW). Эти данные должны отражать текущую, реальную и полную картину бизнеса. Информация в хранилище данных (включая исторические данные) собирается из различных операционных (транзакционных) систем и структурируется специальным образом для более эффективного анализа и обработки запросов (в обличие от обычных баз данных, где информация организована таким образом, чтобы оптимизировать время обработки текущих транзакций).
Хранилища данных содержат огромные объемы информации, охватывающей все доступные стороны деятельности предприятия и позволяющие рассматривать все аспекты функционирования бизнеса в совокупности. Для решения более узких, конкретных задач из общего хранилища могут вычленяться подмножества данных – так называемые витрины данных (data marts).
Интеграция данных
Существует несколько подходов к интеграции данных.
Для формирования и поддержания хранилищ данных используются так называемые ETL-средства – инструменты для извлечения данных (extract), преобразования данных (transform), то есть приведения их к необходимому формату, обработки в соответствии с определенными правилами, комбинировании с другими данными и т.п., а также для загрузки данных (load), записи данных в хранилище или в другую базу. Дмитрий Бородачев, DатаРу Облако: Наше преимущество — мультивендорная модель предоставления облачных услуг
В дополнение к ETL, BI-системы включают в себя инструменты для работы с SQL (structured query language), позволяющие пользователям напрямую обращаться к данным. В последнее время инструменты для формирования и обработки запросов стали более «дружественными», ориентированными на неподготовленных бизнес-пользователей (а не на квалифицированных ИТ-специалистов).
Для интеграции данных из разрозненных источников в современных BI-системах используется промежуточный, виртуальный слой метаданных, что позволяет избавить бизнес-пользователей от необходимости разбираться с тонкостями хранения и обработки информации и облегчающий внесение изменений. Эти средства не требуют никаких физических операций по перемещению и обработке данных, что отличает их от ETL-инструментов. Использование подобного слоя метаданных, в принципе, позволяет отказаться от организации дорогостоящих хранилищ данных (однако при этом необходимо принимать во внимание вопросы обеспечения необходимой производительности). Такой подход к интеграции аналитики из TEC (Technology Evaluation Centers) определяют как EII (enterprise information integration).
Кроме того, для интеграции данных могут создаваться корпоративные порталы, обеспечивающие взаимосвязь на уровне данных и бизнес-процессов. Такие порталы реализуют лишь внешнюю взаимосвязь, иначе говоря – обеспечивают совместный доступ к информации. Такая реализация у экспертов из TEC получила название EAI (enterprise application integration).
Анализ данных
Для всестороннего анализа данных в современных BI используются OLAP-инструменты (online analytical processing). Они позволяют рассматривать различные срезы данных, в том числе временные, позволяющие выявлять различные тренды и зависимости (по регионам, продуктам, клиентам и т.п.).
Для представления данных используются различные графические средства – отчеты, графики, диаграммы, настраиваемые при помощи параметров.
В наиболее развитые BI-решения включены блоки для глубокого исследования данных (data mining). Иногда этот термин ошибочно используют для обозначения инструментов, позволяющих по-новому представить (отобразить) информацию, однако на самом деле эти инструменты призваны помочь в выявлении скрытых (неочевидных) закономерностей, моделей, составления прогнозов. Они основаны на сканировании и статистической обработке огромных массивов данных и в конечном итоге призваны облегчить принятие правильных и обоснованных стратегических решений благодаря анализу различных вариантов развития событий. В качестве инструментов используются нейронные сети, деревья решений.
Панели и карты
Общепринятым средством визуализации данных в современных BI-решениях являются информационные (контрольные, приборные) панели (dashboards), на которых результаты отображаются в виде шкал и индикаторов, позволяющих контролировать текущие значения выбранных показателей, сравнивать их с критическими (минимально\максимально допустимыми) значениями и таким образом выявлять потенциальные угрозы для бизнеса.
Контрольные панели считаются одним из наиболее удобных способов представления информации о «состоянии здоровья» бизнеса. Они позволяют уместить на экране всю важнейшую информацию о текущих операциях, выявленных и потенциальных проблемах.
Контрольные панели, как и карты показателей (scorecards), основаны на анализе ключевых показателей эффективности (KPIs). Однако, как правило, контрольные панели отображают текущее состояние общих показателей, а карты показателей предназначены для сравнения текущих показателей с плановыми, целевыми, и отображают динамику изменения этих показателей во времени. Карты показателей обычно бывают более персонализированными, настраиваются в зависимости от ролей и задач конкретного пользователя (финансовое управление, снабжение, продажи и т.п.). При необходимости все эти показатели могут быть детализированы при помощи дополнительных отчетов, графиков и диаграмм.
См.также
Определение Business Intelligence
Классификация продуктов business intelligence
Преимущества использования BI-системы