2017/08/03 17:09:56

Элементы управления метаданными

Метаданные (от лат. meta — цель, конечный пункт, предел, край и данные) — информация о другой информации, или данные, относящиеся к дополнительной информации о содержимом или объекте. Метаданные раскрывают сведения о признаках и свойствах, характеризующих какие-либо сущности, которые позволяют автоматически искать и управлять ими в больших информационных потоках.

Содержание

Базы данных

Такая информация часто используется в базах данных:

  • Метаданные — это субканальная информация об используемых данных.
  • Структурированные данные, представляющие собой характеристики описываемых сущностей для целей их идентификации, поиска, оценки, управления ими. набор допустимых структурированных описаний, которые доступны в явном виде и предназначение которых может помочь найти объект. Термин используется в контексте поиска объектов, сущностей, ресурсов.
  • Данные из более общей формальной системы, заданную с описывающей свойства системы данных.
  • Информация о содержащейся на веб-странице свойств информации (создателе и т. п.). Пример: Имя автора правки в тексте. Этот термин в широком смысле слова используется для любой информации о данных: именах таблиц, колонок в таблице в реляционных базах данных, номер версии в файле программы (то есть как информативная часть в бинарном файле) и т. п[1].

Различие между данными и метаданными

Обычно невозможно провести однозначное разделение на данные и метаданные в документе, поскольку:

  • Что-то может являться как данными, так и метаданными. Так, заголовок статьи можно одновременно отнести как к метаданным (как элемент метаданных — заголовок), так и к собственно данным (поскольку заголовок является частью самого текста).
  • Данные и метаданные могут меняться ролями. На стихотворение, рассматриваемое как данные, может быть написана музыка, в этом случае всё стихотворение может быть «прикреплено» к музыкальному файлу и в этом случае рассматриваться как метаданные. Таким образом, отнесение к одной или другой категории зависит от точки зрения (или пространства имён, системы отсчёта).
  • Возможно создание мета-мета-…-метаданных (см. аксиома выбора). Поскольку, в соответствии с обычным определением, метаданные являются данными, то можно создать метаданные на метаданные, метаданные для вывода на специальные устройства, либо чтения их описания с использованием программного обеспечения, преобразующего текст в речь.

Другие описательные метаданные могут использоваться автоматизированными рабочими потоками. Например, если некоторая «умная» программа «знает» содержимое и структуру данных, то данные могут быть автоматически преобразованы и переданы другой «умной» программе как входные данные. В результате, пользователи будут освобождены от необходимости выполнения множества рутинных операций, если данные предоставлены для работы такими «немногословными» программами.Витрина данных НОТА ВИЗОР для налогового мониторинга 2 т

Метаданные становятся важны в World Wide Web по причине необходимости обеспечения поиска полезной информации среди огромного количества доступной. Метаданные, созданные вручную, имеют большую ценность, поскольку это гарантирует осмысленность. Если веб-страница на какую-то определённую тему содержит слово или фразу, то все другие веб-страницы на эту тему могут содержать такое же слово или фразу. Метаданные также обладают разнообразием, поэтому если с какой-то темой связаны два значения, то каждое из них может быть использовано. Например, статья про Живой Журнал может быть обозначена с помощью нескольких значений: «Живой Журнал», «ЖЖ», «LiveJournal».

Метаданные используются для хранения информации о записях audio CD. Аналогично MP3 файлы хранят метаданные в формате ID3.

Редактировать метаданные графических файлов можно в специальных программах для работы с метаданными.

Классификация метаданных

Метаданные можно классифицировать по

  • Содержанию. Метаданные могут либо описывать сам ресурс (например, название и размер файла), либо содержимое ресурса (например, «в этом видеофайле показано как парень играет в футбол»).
  • По отношению к ресурсу в целом. Метаданные могут относиться к ресурсу в целом или к его частям. Например, «Title» (название фильма) относится к фильму в целом, а «Scene description» (описание эпизода фильма) отдельное для каждого эпизода фильма.
  • По возможности логического вывода. Метаданные можно подразделить на три слоя: нижний слой — это «сырые» данные сами по себе; средний слой — метаданные, описывающие указанные «сырые» данные; и верхний слой — метаданные, которые позволяют делать логический вывод, используя второй слой.

Тремя наиболее используемыми классами метаданных являются:

  • Внутренние метаданные, описывающие структуру или составные части вещи, то, чем вещь является. Например, формат и размер файла.
  • Административные метаданные, требующиеся для процессов обработки информации, назначение вещи. Например, информация об авторе, редакторе, дата публикации и т. п.
  • Описательные метаданные, которые описывают природу вещи, её признаки. Например, набор связанных с информацией категорий, ссылки на другие вещи, связанные с данной.

Управление метаданными

Управление метаданными - процесс управления данными , связанными с информационными активами организации по обеспечению интеграции, доступа, совместного использования, анализа и пр. для достижения наилучших результатов организации.

Элементы управления метаданными

  • Metadata repositories (Репозиторий метаданных) - используется для хранения, документирования, анализа и управления метаданными. Содержит в себе все данные на протяжении всех этапов жизненного цикла проекта: разработка, тестирование, ввод в промышленную эксплуатацию.
  • Business glossary (Бизнес словарь) - используется для управления бизнес-терминами наряду с соответствующими определениями и отношениями между этими терминами.
  • Data lineage (Происхождение данных) - определяет происхождение данных, этапы преобразования и изменения данных, направление их движения.
  • Impact analysis (Анализ влияния) - предоставление обширной информации относительно зависимостей между данными с последующим влиянием на целевые показатели.
  • Rules management (Управление правилами) - автоматизация соблюдения бизнес-правил, которые привязаны к элементам данных и связанных с ними метаданных.
  • Semantic frameworks (Семантический фреймворк) - поддержка таксономии, ER-модели, онтологии, моделирования языков таких как RDF, OWL и UML.
  • Metadata ingestion and translation (Захват и передача метаданных) - технологии и коннекторы для различных источников данных: RDBMS, BI, DIS, XML, etc.

Источники метаданных

Примеры стандартов мета-моделей

Группировка метаданных

Практическое применение в Сбербанке

Основной целью создания единой базы метаданных является автоматизация и повышение качества бизнес-процессов[2]:

  • Снижение стоимости анализа и проектирования решений
  • Сокращение времени разработки и вывода кода на среды
  • Повышение качества продуктов
  • Контроль соответствия архитектурным требованиям

Единая база метаданных, объединяет результаты анализа и архитектуры проектных решений с метаданными реальных сред.

Архитектура управления метаданными в Сбербанке РФ, 2017 год

Аналитическое пространство, является высокоуровневым описанием тракта данных от систем источников до витрин. Разрабатывается на этапе анализа и проектирования решения.

Реализованное приложение управления метаданными в Сбербанке, 2017 год

Каталог информационных компонент, обеспечивает пользователя полной, оперативной и систематизированной информацией об используемых в комплексе ЦХД – объектах, связях между объектами, компонентах, метриках, размещении.

Реализованное приложение управления метаданными в Сбербанке, 2017 год

Примечания