Программирование >>  Программирование баз данных 

1 ... 333 334 335 [ 336 ] 337 338 339 ... 346


используется для прогнозирования отказов отдельных деталей и систем в самолетах, изучения сложных закономерностей поведения людей в области маркетинга или составления нетривиальных коммерческих прогнозов.

Для выявления скрытых закономерностей используются разные методы, но в целом эти методы сводятся к применению одного или нескольких из многочисленных встроенных алгоритмов или даже тех алгоритмов, которые разработаны самим пользователем. Алгоритмы анализа подразделяются на такие категории, как алгоритмы регрессии и классификации, алгоритмы анализа временнъос рядов, а также алгоритмы определения ассоциаций и формирования последовательностей. В пределах каждой PI3 этих разновидностей алгоритмов существуют многочисленные отдельные реализации, результаты применения которых могут существенно различаться.

Но в любом сл) чае общая цель применения этих алгоритмов состоит в извлечении информации о закономерностях, которые могут оказаться очень сложными.

Общее назначение служб Analysis Services

в основе служб .\nalysis Services лежит очень мощная машина, обеспечивающая применение системы поддержки принятия решений (Decision Support System - DSS) на предприятии. Как правило, данные для службы Analysis Services берутся из одного или нескольких хранилищ данных, но в качестве источника данных не обязательно должно Р1Спользоваться только хранилище данных. В действительности служба Analysis Services позволяет создавать щбы и модели интеллектуального анализа данных на основе многочисленных источников данных, в том числе хранилищ данных и систем OLTP, или даже на основе результатов, полученных с помощью таких сложных методов, как выборка данных из Web-служб или других URL.

Для создания проекта Analysis Services необходимо вьшолнить перечисленные ниже действия.

Определение одного или нескольких источников данных.

Определение представлений источников данных, опирающихся на один или несколько источников данных.

Ввод в действие представлений источников данных путем определения того, какие таблицы являются таблицами фактами и какие - таблицами размерностей.

Установление всех необходимых иерархий данных (в которых, например, учитывается то, что города находятся в конкретных районах, районы относятся к республикам, штатам или областям, а те, в свою очередь, образуют единицы территориального деления государств).

Определение структур интеллектуального анализа данных, которые должны использоваться (если таковые имеются).

Обработка куба (именно с этого фактически начинается анализ).

Для решения задачи определения куба, применяемого в службе Analysis Services, может потребоваться несколько минут (если данные очень просты) или несколько недель (если имеется целый ряд источников данных, закономерности являются сложными, а для проведения сложных определяемых пользователем вычислений и реализации средств интеллектуального анализа данных необходимо создать специализированное программное обеспечение). Возможно, еще более трудоемкая задача состоит в обеспечении надлежащего обучения пользователей, которые обычно



не являются специалистами по базам данных, чтобы они могли понять весь смысл полученных результатов (не одно некачественное решение было получено на основе качественных данных из-за того, что пользователь не стмел понять реальный смысл предъявленных ему результатов).

Создание простого куба

По-видимому, наилучший способ оценить возможности служб Analysis Services (вернее, получить определенное представление о работе этих служб) состоит в изучении небольшого примера.

1. Вначале откройте программ) SQL Server Business Intelligence Development Studio. Выберите узел Business Intelligence Project и создайте, проект Analysis Server (автор назвал этот проект AnalysisServicesExample).

2. Создайте новый источник данных, Data Source, но, в отлргчие от других примеров в этой книге, воспользуйтесь диалоговым окном Impersonation Information, поскольку представленная в нем информация заимствования полномочий обеспечивает возможность использования учетной записи службы.

3. После этого создайте новое представление источника данньгх. Data Source View, на основе только что созданного источника данных. В диалоговом окне Select Tables and Views выберите таблицы DimCustomer, DimGeography, DimProduct, DimTime и FactlntemetSales.

Программа Design Studio обнаружит связи между таблицами и составит схему, которая показана на рис. В.8.

4. Теперь мы можем приступить к наполнению полученного куба данными. Щелкните правой кнопкой мыши на узле Cubes в окне Solution Explorer и выберите команду New Cube.

5. Оставьте неизменными значения, заданные по умолчанию (Build the cube using a data source (Создать куб с использованием источника данных), Auto build (Автоматическое формирование) и Create attributes and hierarchies (Создать атрибуты и иерархии)), и ш;елкните на кнопке Next.

6. Выберите только что созданное представление источника данных и щелкните на кнопке Next.

7. Дождитесь завершения операций в диалоговом окне Detecting Fact and Dimension Tables, a затем снова щелкните на кнопке Next.

8. В диалоговом окне Identify Fact and Dimension Tables выберите таблицу Dim-Time в поле со списком в качестве таблицы размерности времени. Time Dimension Table. Щелкните на кнопке Next.

9. Заполните диалоговое окно Select Time Periods следующим образом:

□ Year = CalendarYear; Half Year = CalendarSemester;

□ Quarter = CalendarQuarter;

□ Month = EnglishMonthName;

□ Date = FullDateAlternateKey;

□ Day of Week = EnglishDayN

□ ameOfWeek.



J DimGeography (dbo.Di...

f GeogrphyKey City

StateProvinteMame

CountryRegionCode

EnglishCountryRegionMa

SpanishCounttyRtgi&nN,.

FrenchCountryRegionNa..,

PostalCode

SalesTemtoryKey

3 DimCustomer cdbo-,

f CustomerKey

GeographyKey Cu:tonnerAltemat... Title

First Name

MiddleMame

La:tName

NameStyle

BitthDate

MaritalStatus

g DimProduct (dfao.Dim.,.

f Pti?duttKey

ProdmtAltemateKey ~

ProdmtSubcateqw , ~

№ightUnitMejsu№ ,

SiseUnitMe ut4C,..

EnglishPreductNma

SpanishPraductMama

FttnchPruductName

StandanJCos!

FinishedGoodsFlaq *i

□ FaetlntemetSles

J DimTime cdbo.DimTi,

} SalesOrderNumber * f SalesOrdeneN ,

PtvductKey

OrdeiOateKey

DueDateKey

ShipDateKey

CustomerKey

PromotionKey

CurrencyKey

SalesTenitwyKey ,

f TimeKey FuliDateAltemateKey ОауМитЬеЮААеек ~ EngiishDayMameOF... SpanishDayNameO... FrenchDayNameOF... DayNumЬeЮfMonth DayNumberOfVear еекИитЬеЮРУеаг

Рис. в. 8. Схема связей между таблицами

10. Щелкните на кнопке Next, чтобы перейти к диалоговому окну Select Measures.

11. Снимите выделение с измерений Promotion Key, Currency Key, Sales Territory Key и Revision Number (они представляют собой всего лишь суррогатные ключи, а не настоящие измерения; в службе Analysis Services принято предположение, что эти ключи представляют собой измерения, поскольку под ними содержатся числовые данные).

12. В диалоговом окне Review Dimensions снимите флажок с атрибута DimProduct => Attributes=>LargePhoto (он представляет собой файл BLOB, в котором хранится изображение схемы атрибутов; эта схема велика и практически не подходит для



1 ... 333 334 335 [ 336 ] 337 338 339 ... 346

© 2006 - 2025 pmbk.ru. Генерация страницы: 0
При копировании материалов приветствуются ссылки.
Яндекс.Метрика