|
Программирование >> Программирование баз данных
средства OLAP (наподобие служб Analysis Services), а также инструментальные средства интеллектуального анализа данных и формирования отчетов. Концептуальная структура и компоненты хранилища данных показаны на рис. В.6. Приложения - источники данных □ Исходные базы данных OLTP Извлечение/ очистка/ преобразование данных OLAP и запросы N 1/ Хранилище данных Отчеты Интеллектуальный анализ данных Рис. В. 6. Концептуальная структура и компоненты хранилища данных Характеристики хранилища данных Хранилище данных обычно создается для поддержки принятия решения и оперативной аналитической обработки, поскольку проект любого хранилища данных обладает следующими уникальными характеристиками. Данные в хранилище данных являются консолидированными и согласованными. В процессе создания и эксплуатации хранилища данных происходит сбор данных из различных источников, а затем осуществляется их консолидация и достигается согласованность с помощью различных способов, включая использование соглашений об именовании, приведение к единой системе мер, унификация физических атрибутов и согласование семантики. Это важно, поскольку деловые аналитики, обращаясь к хранилищу данных и используя его данные в осуществляемых ими процессах принятия решений, должны использовать согласованные стандарты. Например, единому стандарту должны следовать все форматы дат, показывая день, месяц, квартал и год. Данные в хранилище данных должны храниться в единственном допустимом формате. Это позволяет осуществлять выборку, консолидацию и перекрестное сравнение данных, которые получены из многочисленных разнородных источников, таких как мэйнфреймы, хранящие устаревшие данные, электронные таблицы с данными или даже данные из Интернета, что дает возможность аналитикам лучшее понять, что происходит на их предприятии. Данные в хранилище данных упорядочены по темам. Хранилище данных позволяет организовать ьслючевую деловую информацию из таких источников, как базы данных OLTP, чтобы эта информация была доступна для делового анализа. В процессе упорядочения данных происходит отсеивание данных, не относящихся к рассматриваемой теме, которые могут существовать в исходном хранилище данных. Упорядочение данных проводится с учетом того, к какой теме относятся данные, что позволяет, например, отделить данные о заказчиках от данных о товарах, которые, возможно, были смешаны в исходном хранилище данных. Данные в хранилище данных являются результатом накопления в течение определенного времени. В отличие от систем OLTP, предназначенных для оперативной обработки, хранилище данных представляет исторические данные. Иными словами, при выполнении запросов к хранилищу данных используются данные, собранные с помощью системы OLTP в прошлом. Исторические данные могут охватывать более продолжительный период времени по сравнению с тем, который отражен в системе OLTP, поскольку последняя содержит только такие текущие данные, которые главным образом описывают современное состояние системы. Использование данных, предназначенных только для чтения. После перемещения данных в хранилище данных возможность их модификации полностью отсутствует; ис1слючением из этого правила может служить лишь корректировка ранее введенных данных, которые оказались неправильными. Обновление данных в хранилище данных не допускается потому, что они представляют исторические данные, которые не могут измениться. К хранилищам данных не могут применяться операции удаления, вставки и обновления (за исключением тех, что связаны с осуществлением процесса загрузки данных). Единственными операциями, которые могут выполняться в хранилище данных после завершения подготовки его к работе, являются загрузка дополнительных данных и получение данных по запросу. Рынки данных После создания хранилища данных может быть обнаружено, что многие сотрудники конкретной организации обращаются только к определенным частям данных в хранилище данных. Например, коммерческие директора могут обращаться только к данным, относящимся к их отделам. Еще один вариант состоит в том, что они могут запрашивать лишь данные за прошлый год. В таком случае было бы неэффективным решение предусматривать для всех сотрудников возможность вьшолнять запросы ко всему хранилищу данных в целях получения требуемых им отчетов. Поэтому иногда бывает целесообразно разбить одно хранилище данных на меньшие фрагменты, называемые рынками данных, которые в большей степени рассчитаны на конкретные деловые потребности. Еще одна причина, по которой могут создаваться рынки данных, состоит в том, что некоторые организации расположены на нескольких площадках, поэтому доступ к хранилищу данных, находящемуся, например, в штаб-квартире компании, с удаленных площадок может оказаться затруднительным. В частности, коммерческому директору может потребоваться информация о товарах и сбыте, относящаяся лишь к тому региону, на который распространяется его деятельность, тогда как сведения обо всем коммерческом предприятии ему не нужны. В подобных случаях более удобными по сравнению с хранилищами данных становятся рынки данных, тем более что представленные в них объемы данных невелики, поэтому могут поместиться, например, в одном ноутбуке, что позволяет обращаться к нужным данным в любое время. Разумеется, при таких условиях рынки данных функционируют не самостоятельно, а в тесной увязке с хранилищем данных, поэтому должна постоянно обеспечиваться их синхронизация с хранилищем данных. Такая синхронизация может осуществляться с помощью различных способов, например, с использованием служб SQL Server Integration Services (SSIS), сценариев ActiveX или отдельных программ. На рис. В.7 показан пример организационной структуры, в которой совместно с хранилищем данных применяются рынки данных. Приложения - источники данных Исходные базы данных OLTP OLAP и запросы Рынки данных Извлечение/ чистка/ преобразование данных Хранилище данных Интеллектуальный анализ данных Рис. В. 7. Организациюнная структура, в которой приметшютя рынки данных и хранилище данных Интеллектуальный анализ данных Интеллектуальный анализ данных позволяет использовать специализированные математические алгоритмы для выявления в данных сложных связей, образов и тенденций. Такой анализ позволяет извлекать из данных информацию, которая не могла бы быть обнаружена иным путем. В качестве примера могут служить результаты анализа, полученные много лет назад и до сих пор не опровергнутые, согласно которым люди, покупая пиво, вероятнее всего, купят также сыр. Впервые услышав об этом, автор пришел к выводу, что сам бы он не смог обнаружить такую закономерность, и действительно многие, услышав об этом, вначале испытывают чувство удивления. Но эти результаты анализа в конечном итоге не были оставлены без внимания, поэтому в наши дни во многих магазинах можно обнаружить, что рядом с холодильником, где находятся бутылки с пивом, расположен прилавок с пакетиками сыра; таким образом, торговое предприятие извлекает для себя максимальную пользу из этой привычки. Таким образом, интеллектуальный анализ данных показал свою перспективность и в настоящее время находит очень широкое распространение, в частности.
|
© 2006 - 2024 pmbk.ru. Генерация страницы: 0
При копировании материалов приветствуются ссылки. |