Вход

Хранилища данных и базы знаний.

Рекомендуемая категория для самостоятельной подготовки:
Реферат*
Код 196356
Дата создания 18 июня 2017
Страниц 16
Мы сможем обработать ваш заказ (!) 20 мая в 12:00 [мск]
Файлы будут доступны для скачивания только после обработки заказа.
790руб.
КУПИТЬ

Описание

Заключение
В настоящее время активно развивающейся областью применения информационных технологий является использование хранилищ данных и баз знаний и их применение в различных областях науки и техники.
Хранилище данных выполняет следующие функции:
• собирает информацию из различных источников;
• интегрирует данные в логические модели по определенным предметным областям;
• хранит информацию в легко доступной и понятной конечным пользователям форме;
• предоставляет данные конечным пользователям.
Основные функции базы знаний: создание, загрузка, поддержание в актуальном состоянии, расширение, добавление новых знаний, обработка и формирование знаний, соответствующих предметной области.
В рамках данной работы были рассмотрены следующие вопросы:
• Основные понятия хранилищ данных и баз знаний: ...

Содержание

Содержание

Содержание 2
Введение 3
1. Хранилища данных 5
1.1. Введение в хранилища данных. Основные понятия 5
1.2. Общие свойства хранилища данных 6
1.3. Архитектура хранилища данных 8
2. Базы знаний 10
2.1. Основные понятия 10
2.2. Классификация баз знаний 12
2.3. Этапы создания баз знаний 13
2.4. Применение баз знаний 14
Заключение 16
Список используемой литературы 17

Введение

Введение
Эффективное управление бизнес-процессами в настоящее время немыслимо без применения современных информационных технологий –в частности систем поддержки принятия решений (СППР).
Процесс управления –это итерационный процесс, включающий в себя принятие решения – применение управляющего воздействия – оценка состояния системы – оценка правильности выбранного решения – при наличии отклонений снова принятие решения.
Современные информационно-коммуникационные технологии позволяют аналитику эффективно решать следующие классы задач:
• Аналитические задачи, заключающиеся в вычислении заданных показателей и статистических характеристик.
• Визуализация данных.
• Добыча знаний (datamining–проверка статистических гипотез, кластеризация, нахождение ассоциаций и временных шаблонов и т.п.).
• Имита ционные задачи (компьютерное моделирование, описывающие поведение сложных систем).
• Синтез управления, определяющее допустимые управляющие воздействия, обеспечивающие достижение поставленной цели, степень ее достижения.
• Оптимизационные задачи (интеграция имитационных, управленческих, оптимизационных и статистических методов моделирования и прогнозирования, выбор наиболее эффективного решения).
Бизнес – это система, состоящая из множества различных по свойствам подсистем, взаимосвязанных между собой большим количеством связей.
Общая с точки зрения теории познания триада имеет вид:
Гипотеза – модель – решение.
Гипотезапредставляет собой открытие, являющееся новым положением, осуществляется на основе интуиции.
На основе гипотезы строится модель– формальное математическое описание – и находится решение.
Полученное решение проверяется экспериментально (отвергается или принимается). В результате получается знание, которым можно руководствоваться в практике.
В настоящее время стремительно развиваются OLAP- технологии.
OLAP– это инструменты оперативного анализа данных, содержащихся в хранилище данных, и предназначенные для взаимодействия аналитика с проблемой.
Целью данной работы является изучение теоретических основ хранилищ данных и баз знаний.
Для достижения поставленной цели необходимо решить следующие задачи:
• Рассмотреть основные понятия хранилищ данных и баз знаний;
• Выявить основные свойства хранилищ данных;
• Изучить архитектуру хранилищ данных;
• Рассмотреть основные виды баз знаний и области их применения;
• Рассмотреть основные этапы создания баз знаний.

Фрагмент работы для ознакомления

ИнтегрированностьВсе данные о сущностях взаимно согласованы и хранятся в едином общекорпоративном хранилище. Интегрированность проявляется в согласованности имен; единиц измерения переменных; структур данных; физических атрибутов данных и др.Поддержка хронологии (зависимость от времени)Данные хронологически упорядочены и отражают историю за период времени, достаточный для выполнения задач анализа, прогнозирования, сопровождении и помощи в принятии управленческого решения.Неизменяемость (постоянство)Согласованные, верифицированные и внесенные в хранилище исходные данные, остаются постоянными и используются исключительно в режиме чтения.1.3. Архитектура хранилища данныхХранилища данных предназначены для выполнения разнообразных функций, но основным их назначением является – предоставление точных данных в наикротчайшие сроки с минимальными ресурсными затратами. Для успешной деятельности компаний необходимо, чтобы доступ к информации был дешевым и занимал мало времени. Хранилище данных на самом верхнем уровне состоит, как правило, из трех подсистем:1) Подсистема загрузки данных.Данная подсистема включает в себя программное обеспечение, которое по определенным правилам извлекает данные из источников и приводит их к нужному формату, определенному в хранилище. Также подсистема загрузки данных отвечает за формализованную логическую согласованность, качество и интеграцию данных, загруженных из различных источников в оперативный склад данных. Для каждого источника данных необходимо разрабатывать индивидуальный загрузочный модуль, который должен решать следующие классы задач:Начальная загрузка ретроспективных данных;Регламентное пополнение хранилища данными из источников.Также подсистема загрузки данных выполняет функции регламентированного извлечения детальных данные из оперативного склада, их агрегирования, консолидации, модификации и размещения данных в хранилище и витрины данных. Именно в данной подсистеме должны быть определены все бизнес-модели консолидации данных по иерархическим измерениям и вычисления зависимых бизнес-показателей по независимым исходным данным.2) Подсистема обработки запросов и представления данных. Инфраструктуру данной подсистемы составляют оперативный склад, хранилище и витрины данных, обеспечивающие хранение и администрирование данных. Специализированное программное обеспечение, входящее в состав подсистемы обработки запросов и представления данных обеспечивает извлечение данных, их аналитическую обработку и предоставления конечным пользователям в надлежащей форме.Как правило, выделяют три вида данного программного обеспечения:Программное обеспечение регламентированной отчетности, характеризующееся заранее предопределенными запросами данных и их представлениями конечным пользователям. К данному классу программного обеспечения не предъявляется требований быстрой временной реакции, поэтому для его реализации в наибольшей степени подходит технология ROLAP.Программное обеспечение нерегламентированных запросов пользователей. Данный класс программ – это основное средство общения конечных пользователей с хранилищем, при котором каждый последующий запрос к данным и форма их представления определяются, как правило, результатами предыдущего запроса. Для программ данного класса требуется высокая скорость обработки запросов. Данные программные средства реализуются технологией MOLAP и специализированными инструментами построения сложных нерегламентированных запросов с интуитивно понятным для конечных пользователей графическим интерфейсом.Программное обеспечение добычи знаний, реализующее сложные статистические алгоритмы и алгоритмы искусственного интеллекта, предназначенные для поиска скрытых в данных закономерностей, представления этих закономерностей, представления этих закономерностей в виде моделей и многовариантного прогнозирования по ним развития ситуаций по схеме «Что если …?».3) Подсистема администрирования хранилища.В функции данной подсистемы входят все задачи, обеспечивающие поддерживание системы и ее расширений в устойчивом рабочем состоянии.Среди задач данной подсистемы можно выделить следующие классы задач:Администрирование данных, заключающееся в регулярном пополнении хранилища данными из различных источников (ручной ввод, сверка и корректировка данных в оперативном складе). Администрирование данных, как правило, осуществляется конечными пользователями, а ответственность распределяется по предметно-ориентированным сегментам.Администрирование хранилища данных, связанное с поддержанием архитектуры хранилища, его эффективной и устойчивой работы, защитой и восстановлением данных после сбоев.Администрирование доступа к данным, заключающееся в сопровождении профилей пользователей, разграничении доступа к конфиденциальным данным, защиту информации от несанкционированного доступа.Администрирование метаданных системы [ REF _Ref421732898 \r \h 6].2. Базы знаний2.1. Основные понятияДанные – это отдельные факты, характеризующие объекты, процессы и явления предметной области, а также их свойства.Знания – это результат мыслительной деятельности человека, направленной на обобщение его опыта, полученного в результате практической деятельности. Таким образом, знания основаны на данных, полученных эмпирическим путем.Знания – это закономерности предметной области (принципы, связи, законы), полученные в результате практической деятельности и профессионального опыта, позволяющие специалистам ставить и решать задачи в этой области.Знания – это хорошо структурированные данные, или данные о данных, или метаданные.База данных – организованная в соответствии с определёнными правилами и поддерживаемая в памяти компьютера совокупность данных, характеризующая актуальное состояние некоторой предметной области и применяемая для удовлетворения информационных потребностей конечных пользователей.База знаний (англ. Knowledge base, KB) – это особого рода база данных, разработанная для управления знаниями (метаданными), то есть сбором, хранением, поиском и выдачей знаний.Существует целый раздел искусственного интеллекта, занимающийся изучением баз знаний и методами работы со знаниями, – инженерия знаний.База знаний – это совокупность фактов и правил вывода, допускающих логический вывод и осмысленную обработку информации.Например, в языке программирования Пролог базы знаний описываются в виде конкретных фактов и правил логического вывода над базами данных и процедурами обработки информации, представляющих сведения и знания о людях, предметах, фактах событиях и процессах в логической форме.Выделим ряд принципиальных отличий баз знаний от баз данных (табл. 2)Таблица 2Отличия баз знаний от баз данныхПризнакБазы данныхБазы знанийСодержимоемогут работать с однородными даннымимогут содержать разнородные и разнотипные данныеМодельпредставляет собой жестко структурированную модельпредставляют собой открытую модельФорма представления содержимогоданные представлены в виде набора записейзнания представлены в виде семантической сетиЗнания в базах знаний можно разделить на следующие виды:процедурные (алгоритмические) знания – это процедуры (программы, алгоритмы), вычисляющие функции, выполняющие преобразования, решающие задачи, поддающиеся строгой формализации.неалгоритмические знания состоят из объектов, называемых понятиями. Понятие обычно имеет имя, определение, четкую структуру (составные элементы), связано с другими понятиями и входит в какую-то систему понятий. Другие неалгоритмические знания – это связи между понятиями или утверждения о свойствах понятий и связях между ними [ REF _Ref421792295 \r \h 1, REF _Ref421792297 \r \h 3].2.2. Классификация баз знанийВ зависимости от уровня сложности систем, в которых применяются базы знаний, подразделяются на:Глобальные базы знаний. Примерами могут служить глобальная сеть Интернет и т.п.Национальные базы знаний. Например, Википедия.Отраслевые базы знаний.

Список литературы

Список используемой литературы
1. Абдикеев Н.М., Киселёв А.Д. Управление знаниями корпорации и реинжиниринг бизнеса: Учебник/ Под науч. ред. д-ра техн. наук, проф. Н. М. Абдикеева. – М.: ИНФРА-М, 2011. – 382 с.
2. Архипенков С., Голубев Д., Максименко О. ХРАНИЛИЩА ДАННЫХ. От концепции до внедрения – М.: ДИАЛОГ-МИФИ, 2002.
3. Базы знаний интеллектуальных систем / Т. А. Гаврилова, В. Ф. Хорошевский – СПб.: Питер, 2000 – 384 с.
4. Информационные технологии: учебник / под ред. В. В. Трофимова. – М.: Издательство Юрайт; ИД Юрайт, 2011. – 624 с.
5. Пирогов В.Ю. Информационныесистемыибазыданных:организацияи проектирование. – СПб.: БХВ-Петербург, 2009. – 528с.
6. Спирли, Эрик. Корпоративные хранилища данных. Планирование, разработка, реализация. Том 1. – М.: Издательский дом «Вильямс», 2001.
7. Туманов В.Е. Проектированиехранилищданныхдлясистембизнес-аналитики: учебное пособие. – М.:Интернет-Университет Информационных технологий: БИНОМ. Лаборатория знаний, 2010 – 615с.
Очень похожие работы
Пожалуйста, внимательно изучайте содержание и фрагменты работы. Деньги за приобретённые готовые работы по причине несоответствия данной работы вашим требованиям или её уникальности не возвращаются.
* Категория работы носит оценочный характер в соответствии с качественными и количественными параметрами предоставляемого материала. Данный материал ни целиком, ни любая из его частей не является готовым научным трудом, выпускной квалификационной работой, научным докладом или иной работой, предусмотренной государственной системой научной аттестации или необходимой для прохождения промежуточной или итоговой аттестации. Данный материал представляет собой субъективный результат обработки, структурирования и форматирования собранной его автором информации и предназначен, прежде всего, для использования в качестве источника для самостоятельной подготовки работы указанной тематики.
bmt: 0.00483
© Рефератбанк, 2002 - 2024