В системах, используемых для автоматизации бизнес-процессов современных компаний, реализуются два следующих основных подхода:

-подход, основанный на OLTP-технологии оперативной обработки транзакций (соответствующие системы также называют автоматизированными системами обработки данных или транзакциоными системами);

-подход, основанный концепции хранилищ данных.

 

Опережающее развитие OLTP-технологий характерно как для всей отрасли информационных технологий, так и для конкретного предприятия, развивающего собственную автоматизацию. Это связано с тем, что транзакционные системы, во-первых, позволяют навести порядок именно в процессах повседневной рутинной обработки (переработки) данных, что является первоочередной задачей автоматизации, а, во-вторых, именно они являются, по сути, источниками данных для аналитических систем. Однако, если развитие технологии хранилищ данных запаздывает, возникает парадоксальная ситуация, при которой на предприятии накоплены большие архивы исторических данных, но использовать их для решения конкретных аналитических задач невозможно. Дело в том, что на достаточно большом предприятии (корпорации), как правило, используется несколько, а иногда и достаточно много информационных систем. Данные в системах могут быть структурированы различным образом. Они плохо стыкуются между собой. Их трудно интегрировать. Другой причиной сложности использования этих данных для анализа является то, что используемые в них структуры данных формируются для оптимального выполнения операций ввода и редактирования данных. Операции поиска данных по сложным критериям и их агрегации при этом нередко требуют большого времени и, что еще хуже, тормозят работу операторов, осуществляющих ввод и редактирование оперативных данных. Поэтому, например, операции формирования отчетов традиционно выполняются в таких системах в то время, когда оперативная нагрузка на системы снижается, то есть, чаще всего, ночью.

 

Чтобы упростить решение указанных выше проблем, создаются корпоративные хранилища данных. Хранилища данных содержат выверенную и согласованную информацию, предназначенную для использования в информационно-аналитических системах и системах поддержки принятия решений. Информация в них хранится в специальной форме, удобной для быстрого выполнения различных запросов, позволяющих предоставлять данные в различных разрезах с различной степенью агрегации. Эти данные могут быть востребованы непосредственно, а также могут использоваться для реализации нескольких витрин данных, представляющих собой, по сути, специализированные аналитические базы данных для решения конкретных задач, например, поддерживающие прогнозирование спроса, планирование производства или анализ издержек.

 

Следует особо отметить, что информация, собираемая в хранилищах данных, существенно отличается от информации в OLTP-системах. Основные отличия представлены в таблице (таблица 1 ).

 

Таблица 1 — Сравнение характеристик данных в OLTP-системах и хранилищах данных

Характеристика данныхOLTP-системыХранилища данных
Частота обновленияВысокая частота, маленькими порциямиМалая частота, большими порциями
Источники данныхВ основном — внутренниеВ основном — внешние
Объемы хранимых данныхСотни мегабайт, гигабайтыГигабайты и терабайты
Возраст данныхТекущие (за период от нескольких месяцев до одного года)Текущие и исторические (за период в несколько лет, десятки лет)
НазначениеФиксация, оперативный поиск и преобразование данныхХранение детализированных и агрегированных исторических данных, аналитическая обработка, прогнозирование и моделирование

 

Необходимость создания хранилищ данных кроме того связана с потребностями в специфических способах визуализации информации для руководителей, в формировании не только регламентированных отчетов, характерных для OLTP-систем, но и отчетов по произвольным запросам, представляющих данные в различных разрезах и с различной степенью агрегации. Хранилище данных должно обеспечить высших руководителей компании информацией для формирования и коррекция целей развития корпорации, принятия стратегических решений.