Рекомендуемая категория для самостоятельной подготовки:
Реферат*
Код |
576276 |
Дата создания |
2020 |
Страниц |
2
|
Мы сможем обработать ваш заказ (!) 18 ноября в 12:00 [мск] Файлы будут доступны для скачивания только после обработки заказа.
|
Содержание
Введение
Методы анализа данных
Решение аналитических задач
Проверка моделей
Фрагмент работы для ознакомления
Анализ данных используется во всех сферах человеческой деятельности как основа для проведения исследований, принятия управленческих решений и т.д. От правильности принимаемых решений (получаемых результатов) зависит развитие той или иной научной области, конкурентоспособность организации. Таким образом, проведение эффективного анализа данных является актуальной задачей для любой сферы человеческой деятельности.
Методы анализа данных
Методы, используемые для анализа данных из любой сферы человеческой деятельности, имеют статистическую природу. Существует большое количество различных методов для анализирования данных, опирающихся на различные гипотезы, параметры данных, такие как распределение, среднее значение и т.д.
Как правило, для анализа выбирается некоторый объем данных, называемый выборкой. Выборка – это часть большой группы данных, полностью описывающей свою предметную область. В статистике такую группу называют генеральной совокупностью.
Как правило, для решения конкретной задачи исследователю или аналитику нет необходимости работать со всей группой данных, ему нужна лишь определенная часть. К тому же, чем больший размер имеет выборка данных, тем сложнее ее обрабатывать и хранить на технических устройствах.
Решение аналитических задач
Большая часть статистических методов для анализа данных предполагает наличие у группы данных нормального распределения. Распределение выборки определяет ее поведение, позволяет определять значения элементов выборки.
К сожалению, огромное количество практических задач требует от аналитика работать с наборами данных, чье распределение не соответствует нормальному, либо вообще неизвестно. В таком случае, классические статистические методы оказываются бесполезными, так как результаты анализа данных, полученные с их помощью, не являются достоверными и не позволяют охарактеризовать выборку.
Для решения указанной проблемы, начиная примерно с 1960-х годов, многими специалистами разрабатываются методы анализа данных, не зависящие от распределения и прочих параметров данных. К этим методам относится так называемый «data mining», что переводится как «добыча данных».
Цель этих методов – поиск скрытых закономерностей в массивах данных, которые невозможно корректно исследовать с помощью классических статистических методов.
Проверка моделей
Стоит отметить, что не все выборки для реальных задач не могут быть обработаны с помощью классических методов. Более того, сильной стороной классических методов является оценка достоверности результатов. Если параметры метода показывают, что полученный результат является достоверным, то сомневаться в полученном результате не приходится.
Методы, относящиеся к группе «data mining», напротив, далеко не всегда имеют достаточную базу для оценки достоверности полученного результата. Основным способом проверки моделей, построенных с помощью указанных методов, является использование так называемой тестовой выборки.
Выборка, используемая для создания модели, называется обучающей. Выборка, не совпадающая по содержанию с обучающей, но имеющая значения в аналогичном диапазоне, называется тестовой в случае, если она используется для проверки модели, построенной на основе обучающей выборки.
Список литературы
1 Бергер, А.Б. MS SQL Server 2005 Analysis Services. OLAP и многомерный анализ данных / А.Б. Бергер. — СПб.: BHV, 2007. — 928 c.
2 Кацко, И.А. Практикум по анализу данных на компьютере / И.А. Кацко, Н.Б. Паклин. — М.: КолосС, 2009. — 278 c.
3 Крянев, А.В. Метрический анализ и обработка данных / А.В. Крянев, Г.В. Лукин, Д.К. Удумян. — М.: Физматлит, 2012. — 308 c.
4 Кулаичев, А.П. Методы и средства комплексного анализа данных: Учебное пособие / А.П. Кулаичев. — М.: Форум, НИЦ ИНФРА-М, 2013. — 512 c.
5 Лебедев, Ю.А. Характеристики углеводородов: Анализ численных данных и их рекомендованные значения. Справочное издание / Ю.А. Лебедев, А.Н. Кизин, Т.С. Папина, И. Сайфуллин. — М.: Ленанд, 2012. — 560 c.
6 Лесковец, Ю. Анализ больших наборов данных / Ю. Лесковец, А. Раджараман. — М.: ДМК, 2016. — 498 c.
Пожалуйста, внимательно изучайте содержание и фрагменты работы. Деньги за приобретённые готовые работы по причине несоответствия данной работы вашим требованиям или её уникальности не возвращаются.
* Категория работы носит оценочный характер в соответствии с качественными и количественными параметрами предоставляемого материала. Данный материал ни целиком, ни любая из его частей не является готовым научным трудом, выпускной квалификационной работой, научным докладом или иной работой, предусмотренной государственной системой научной аттестации или необходимой для прохождения промежуточной или итоговой аттестации. Данный материал представляет собой субъективный результат обработки, структурирования и форматирования собранной его автором информации и предназначен, прежде всего, для использования в качестве источника для самостоятельной подготовки работы указанной тематики.
bmt: 0.00489