Рекомендуемая категория для самостоятельной подготовки:
Контрольная работа*
Код |
297862 |
Дата создания |
16 марта 2014 |
Страниц |
29
|
Мы сможем обработать ваш заказ (!) 27 декабря в 12:00 [мск] Файлы будут доступны для скачивания только после обработки заказа.
|
Описание
Контрольная работа по дисциплине "Анализ данных"
Тема: «Дисперсионный анализ».
С подробным решением и графиками
Сдана на отлично
Текст задач в содержании ...
Содержание
Содержание
Задача № 5 …………………………………………………………………... 3
Запишите и прокомментируйте формулу для каждой из указанных ниже величин, которые используются в однофакторном дисперсионном анализе.
Общий размер выборки, n.
Общее (главное) среднее, Х ̅.
Межгрупповая вариация и соответствующее число степеней свободы.
Внутригрупповая вариация и соответствующее число степеней свободы.
F – статистика и соответствующее число степеней свободы.
F - таблица.
Задача № 7………………………………………………………………….. 4
Была осуществлена проверка трех рекламных акций. В каждом случае использовались разные случайные выборки потребителей из одного и того же города. Оценки характеризуют эффективность рекламы; результаты приведены в следующей таблице:
Реклама - 1 Реклама - 2 Реклама - 3
Среднее 63,2 68,1 53,5
Стандартное отклонение 7,9 11,3 9,2
Размер выборки (потребителей) 101 97 105
Какая реклама оказалась наиболее, а какая наименее эффективной?
Определите общий объем выборки, n, общее среднее, X ̅, и число выборок k.
Вычислите межгрупповую вариацию и число степеней свободы для нее.
Вычислите внутригрупповую вариацию и число степеней свободы для нее.
Задача № 16………………………………………………………………….. 5
Чтобы лучше распределять свое рабочее время, вы провели небольшое исследование, фиксируя время, затраченное на каждый
телефонный звонок (в минутах) в течение одного рабочего
дня. Перед тем как внести изменения в организацию своей ра¬боты (например, переадресовать некоторые звонки своим под¬чиненным), вы хотите разобраться в этой ситуации. Продолжи¬тельность звонков, сгруппированных по определенным темам, приведена в следующей таблице:
Информация Продажи Обслуживание Остальные
0,6 5,1 5,2 6, 3
1,1 1,7 2,9 1,2
1,0 4,4 2,6 3,1
1,9 26,6 1,2 2,5
3,8 7,4 7,0 3,0
1,6 1,4 14,2 2,6
0,4 7,0 8,4 0,8
0,6 3,9 0,6
2,2 3,1 26,7
12,3 1,2 7,7
4,2 1,9 4,8
2,8 17,3 7,2
1,4 7,8 2,7
4,3 3,4
3,4 13,3
1,3
2,0
1) Постройте в одном масштабе блочные диаграммы для этих четырех видов звонков и опишите полученную структуру.
2) Вычислите среднее и стандартное отклонения для ка¬ждого вида телефонных звонков.
3) Какой из типов звонков имеет наибольшую среднюю продолжительность, а какой наименьшую?
4) Выполняется ли для данного набора данных необходи¬мое для однофакторного дисперсионного анализа предположение о нормальном распределении и равной вариации? Почему?
5) Вычислите для каждого значения натуральный лога¬рифм и постройте блочные диаграммы для этих логарифмов.
6) Можно ли сказать, что предположение о равной ва¬риации лучше выполняется для логарифмов, чем для исходных данных?
Задача № 20………………………………………………………………….. 9
Проверяются различия качества сырья трех поставщиков на не¬котором производстве: Amalgamated (поставщик A), Bipolar (поставщик B) и Consolidated (поставщик C). Вам поручено собрать и проанализировать данные об этом качестве в виде его оценок 5- ю случайно выбранными работниками каждой из трех смен предприятия по 100-балльной шкале (оценка - неот¬рицательное целое число). Представьте, что данные собраны. Заполните ими следующую таблицу (у каждого решающего задачу - свои данные; заранее допустив значимые различия в качест¬ве сырья каких-то из поставщиков A, B, C, можно смоделиро¬вать эти различия исходными данными; можно обдумать причи¬ны, по которым оценки качества сырья взятого поставщика значимо разнятся в сменах, и смоделировать также действие этих причин):
Дневная смена Ночная смена Пересменка
A B C A B C A B C
Двухфакторный дисперсионный анализ качества продукции
Источник вариации DF SS MS F p
Смена
Поставщик
Смена X поставщик
Ошибка
Итого
1) Создайте таблицу средних значений качества для вы¬бранной комбинации поставщика и смены в виде
Дневная смена Ночная смена Пересменка Среднее
Поставщик A
Поставщик B
Поставщик C
Среднее
и выполните при помощи этой таблицы однофакторный дисперси¬онный анализ (ANOVA), выбрав в качестве признака средний показатель качества сырья в ячейке, а в качестве фактора - переменную «фирма-поставщик». Почему по этим данным нельзя выполнить двухфакторный дисперсионный анализ (убедитесь в этом в среде SPSS)?
2) В дополнение к проведенному однофакторному диспер¬сионному анализу (ANOVA) выполните множественный регресси¬онный анализ с индикаторными (фиктивными) переменными (см. тему «Множественная регрессия»). С этой целью создайте за¬висимую переменную Y, поместив средние в сменах оценки ка¬чества сырья в одном длинном столбце, например, для удобст¬ва ввода данных в алфавитном порядке по поставщику: сначала оценки сырья Amalgamated (поставщик A), затем Bipolar (по¬ставщик B) и, далее, Consolidated (поставщик C).
3) Далее, создайте две индикаторные переменные X1, X2 для введения в модель регрессии качественного предиктора «компания-поставщик», со следующей таблицей кодирования:
X₁ X2
Amalgamated 1 0
Bipolar 0 1
Consolidated 0 0
Постройте уравнение регрессии и проведите тестирование зна¬чимости влияния предиктора на зависимую переменную.
4) Сравните результат F- теста, полученный из регрес¬сионного анализа, с результатом F- теста, полученным из однофакторного дисперсионного анализа. Дают ли эти два метода — множественная регрессия и однофакторный дисперсионный анализ — разные результаты, или результаты полностью совпа¬дают? Как вы думаете, почему это именно так?
5) Сравните коэффициенты регрессии (наклоны) для ин¬дикаторных переменных в уравнении регрессии с разностями средних значений оценок качества для разных поставщиков (эти средние значения содержатся в последнем столбце «Сред¬нее» в таблице средних). Прокомментируйте полученный ре¬зультат.
6) Выполните двухфакторный дисперсионный анализ ис¬ходных данных и заполните соответствующую таблицу, приве¬денную выше. Прокомментируйте полученные результаты в ас¬пекте значимости влияния на показатели качества сырья фак¬торов «смена» и «поставщик» и их взаимодействия. Классифи-цируйте тип взаимодействия и проиллюстрируйте его графиче¬ски.
Задача № 26………………………………………………………………….. 14
Объедините размеры годовой заработной платы в три группы в
соответствии с уровнем квалификации служащих ( А, В и С) и
1) Для сравнения этих трех групп постройте блочные диаграммы и прокомментируйте их.
2) Найдите среднее значение для каждого уровня квали¬фикации и прокомментируйте его.
3) Найдите межгрупповую и внутригрупповую вариацию и соответствующие им степени свободы.
4) Найдите значение F — статистики и количество степе¬ней свободы для нее.
5) Выполните F — тест на уровне 0,05 и представьте ре¬зультаты.
6) Изложите результаты теста наименьшего значимого различия, если он может быть применен (тест наименьшего значимого различия - в точности то же, что и предусмотрен¬ный в SPSS сравнительный анализ влияния различных уровней фактора на исследуемый признак, см. Лекцию 2, стр.18 и при¬меры из Case Studies в SPSS).
7) Обобщите, что вы узнали из базы данных относитель¬но этой проблемы.
Задача № 35………………………………………………………………….. 17
Представьте себе, что данные в однофакторном эксперименте
распределены по четырем группам, каждая из которых состоит
из восьми элементов.
Заполните пропуски в приводимой ниже сводной таблице ANOVA, объяснив, чем в ней являются величины c и n .
Вид вариативно¬сти Количество степеней свободы Сумма квад-ратов Дисперсия F — статистика
Межгрупповая вариативность признака c -1 = ? SSA = ? MSA = 80 F = ?
Внутригрупповая вариативность признака n - c = ? SSW = 560 MSW = ?
Полная вариативность признака n -1 = ? SST = ?
Задача № 42………………………………………………………………….. 18
☼ Компания, производящая шариковые авторучки, наняла рек¬ламное агентство, чтобы организовать общенациональную рек¬ламную кампанию. Для начала директор компании решил иссле¬довать влияние рекламы на восприятие их продукции. Был ор¬ганизован эксперимент, в котором сравнивались пять видов рекламы шариковых авторучек. В рекламе А свойства авторучек были сильно занижены, в рекламе Б — занижены умеренно, в рекламе В — слегка преувеличены, в рекламе Г — сильно пре¬увеличены, и лишь в рекламе Д характеристики ручек описыва¬лись объективно. Из крупной фокус - группы была извлечена вы¬борка, в которую были включены 30 респондентов, случайным образом распределенные по пяти группам, соответствующим разным видам рекламы (по шесть человек в группе). Прочитав рекламное объявление и сформировав свое представление о продукции компании, респонденты получали авторучки одного и того же вида, испытывали их и оценивали достоверность рек¬ламных обещаний. Респондентов просили оценить внешний вид, долговечность и качество авторучек по семибалльной шкале. Суммарный рейтинг рекламы, учитывающий баллы по каждому из показателей (внешний вид, долговечность и качество), по¬ставленные каждым из 30 респондентов, приведены в файле ☼ PEN . XLS.
1) Существует ли статистически значимая разница между средними рейтингами разных рекламных объявлений, если уро¬вень значимости равен 0,05?
2) Определите, рейтинг какого рекламного объявления отличается от среднего, если это возможно.
3) Существует ли статистически значимая разница между дисперсиями рейтингов разных рекламных объявлений, если уровень значимости равен 0,05?
4) Как результат решения пункта 3 влияет на коррект¬ность результатов решения пунктов 1 и 2?
Задача № 44………………………………………………………………….. 20
Компания, производящая спортивные товары, желает сравнить расстояние, которое пролетают мячи для гольфа, изготовлен¬ные по четырем разным технологиям. По каждой технологии бы¬ло произведено по десять мячей. Затем эти мячи были переда¬ны местному гольф-клубу для испытаний. Порядок следования мячей был случайным. Все 40 мячей были испытаны в течение короткого отрезка времени при одинаковых погодных условиях. Результаты испытания (в ярдах) приведены в таблице:
Технология
1 2 3 4
206,32 203,81 217,08 213,90
226,77 223,85 230,55 231,10
207,94 206,75 221,43 221,28
224,79 223,97 227,95 221,53
206,19 205,68 218,04 229,43
229,75 234,30 231,84 235,45
204,45 204,49 224,13 213,54
228,51 219,50 224,87 228,35
209,65 210,86 211,82 214,51
221,44 233,00 229,49 225,09
1) Можно ли утверждать, что среднее расстояние, кото¬рое пролетают мячи для гольфа, произведенные по разным тех¬нологиям, неодинаково, если уровень значимости равен 0,05?
2) Если среднее расстояние, которое пролетают мячи для гольфа, произведенные по разным технологиям, неодинако¬во, примените процедуру Тьюки-Крамера и определите отличаю¬щиеся группы.
3) Какие условия должны выполняться при решении пунк¬та 1? Выполняются ли эти условия?
4) Какую технологию следует предпочесть? Обоснуйте свою рекомендацию.
Исходя из того, что тест Левенэ оказался значимым, мы сделали вывод о том, что дисперсии рейтингов разных рекламных сообщений равны, следовательно, результаты проведенного анализа корректны.
Задача № 45………………………………………………………………….. 22
Допустим, что при двухфакторном эксперименте факторы А и В имеют по три уровня. В каждой из девяти ячеек (cells), со¬ответствующих комбинациям уровней факторов А и В, находятся по четыре реплики.
1) Сколько степеней свободы существует при определе¬нии вариации фактора А?
2) Сколько степеней свободы существует при определе¬нии вариации фактора В?
3) Сколько степеней свободы существует при определе¬нии вариации взаимодействия факторов?
4) Сколько степеней свободы существует при определе¬нии вариации случайной ошибки?
5) Сколько степеней свободы существует при определе¬нии полной вариации?
Задача № 46………………………………………………………………….. 23
Рассмотрим эксперимент, описанный в задаче 45.
1) Предположим, что SSA = 120 , SSB = 110 , SSE = 270 и SST = 540. Чему равна величина SSAB?
2) Чему равна величина MSA?
3) Чему равна величина MSB?
4) Чему равна величина MSAB?
5) Чему равна величина MSE?
6) Чему равна F - статистика для эффекта взаимодейст¬вия?
7) Чему равна F- статистика для эффекта фактора А?
8) Чему равна F- статистика для эффекта фактора В?
9) Заполните сводную таблицу дисперсионного анализа.
Задача № 53………………………………………………………………….. 24
Студенты, изучающие статистику, провели факторный экспе¬римент, в ходе которого измерялось время растворения боле¬утоляющих таблеток в стакане воды. В эксперименте исследо¬вались два фактора: торговая марка (Equate, KROGER, Alka-Seltzer) и температура воды (теплая или холодная). Продолжительность растворения (в секундах) 24 таблеток приведены таблице, см. файл PAIN-RELIEF.XLS.
Торговая марка
Вода EQUATE KROGER ALKA-SELTZER
Холодная 85,87 75, 98 100,11
78, 69 87, 66 99, 65
76,42 85,71 100,83
74,43 86,31 94,16
Горячая 21,53 24,10 23,80
26,26 25,83 21,29
24, 95 26,32 20,82
21,52 22, 91 23,21
1) Существует ли статистически значимый эффект взаи¬модействия между разновидностью таблетки и временем ее рас¬творения, если уровень значит равен 0,05?
2) Существует ли статистически значимый эффект разно¬видности таблетки, если уровень значимости равен 0,05?
3) Существует ли статистически значимый эффект темпе¬ратуры воды, уровень значимости равен 0,05?
4) Постройте график средней продолжительности раство¬рения таблеток каждой разновидности при двух температурах воды.
5) Объясните результаты решения п.п. 1 и 3.
Задача № 55………………………………………………………………….. 27
В одном из экспериментов исследовалась прочность автомо¬бильных шин, зависящая от длины шипов и вида установки. Данные помещены в следующую таблицу (файл GEAR.XLS).
Установка
Длина шипов НИЗКАЯ ВЫСОКАЯ
Короткие
18,0 13,5
16,5 8,5
26,0 11,5
22,5 16, 0
21,5 -4,5
21,0 4,0
30,0 1,0
24,5 9,0
Длинные
27,5 17,5
19,5 11,5
31,0 10,0
27,0 1,0
17,0 14,5
14,0 3,5
18,0 7,5
17,5 6,5
1) Существует ли статистически значимый эффект взаи¬модействия между установкой шины и длиной шипов, если уро¬вень значимости равен 0,05?
2) Существует ли статистически значимое влияние длины шипов на прочность шины, если уровень значимости равен 0,05?
3) Существует ли статистически значимое влияние вида установки шины на ее прочность, если уровень значимости ра¬вен 0,05?
4) Постройте график средней прочности шин для каждого вида шипов при разных видах установки.
5) Объясните результаты решения п. п. 1-4.
Введение
Контрольная работа по дисциплине "Анализ данных"
Тема: «Дисперсионный анализ».
С подробным решением и графиками
Сдана на отлично
Фрагмент работы для ознакомления
Прокомментируйте полученный результат.Выполните двухфакторный дисперсионный анализ исходных данных и заполните соответствующую таблицу, приведенную выше. Прокомментируйте полученные результаты в аспекте значимости влияния на показатели качества сырья факторов «смена» и «поставщик» и их взаимодействия. Классифицируйте тип взаимодействия и проиллюстрируйте его графически. Решение.Создадим таблицу данных и таблицу средних:№ Дневная сменаНочная сменаПересменкаАВСАВСАВС14095653880403882482459075408442428650360927845825046905245086693588564884485559380207860529456Дневная сменаНочная сменаПересменкаСреднеепоставщик А5035,645,243,6поставщик В91,282,487,286,93поставщик С73,449,650,857,93Среднее71,5355,8761,07При помощи таблицы средних значений проведем однофакторный дисперсионный анализ, используяв качестве признака средний показатель качества сырья в ячейке, а в качестве фактора переменную «поставщик». Введем данные в spss и запустим процедуру однофакторного дисперсионного анализа:146939020955Проведя однофакторный дисперсионный анализ, приходим к выводу, что допущение модели об однородности дисперсии выполняется, поскольку согласно тесту Левенэ 0,105>0,05), а сама модель, в свою очередь, является статистически значимой (0,003<0,05).Критерий однородности дисперсийсредний_показатель_качестваСтатистика Левенэdf1df2Знач.3,36626,105Таблица дисперсионного анализа ANOVAсредний_показатель_качестваСумма квадратовdfСредний квадратFЗнач.Между группами2924,22221462,11117,341,003Внутри групп505,893684,316Итого3430,1168Если мы добавим в эту модель еще один фактор «смена», выполнить двухфакторный дисперсионный анализ все равно не удастся, проверим данный вывод в spss.Оценка эффектов межгрупповых факторовЗависимая переменная:средний_показатель_качестваИсточникСумма квадратов типа III dfСредний квадратFЗнач.Скоррект.модель3430,116a8428,764..Свободный член35519,684135519,684..поставщик2924,22221462,111..смена382,0362191,018..поставщик * смена123,858430,964..Ошибка,0000.Всего38949,8009Скоррект.итог3430,1168a. R Squared = 1,000 (Adjusted R Squared = .)Это связано с тем, что в данных слишком малая вариативность, встречается только по одному значению каждого из факторов влияния. То есть существует всего по одной реплике, а этого недостаточно.3672840262255Построим множественную регрессию, предварительно закодировав переменную тип поставщика следующим способом:X₁X2Amalgamated10Bipolar01Consolidated00Таким образом, модель, в целом, оказалось значимой на пятипроцентном уровне значимости, поскольку наблюденная значимость <0,05.. Модель описывает 85,3% случаев влияния поставщика на среднюю оценку качества сырья в смене.Уравнение регрессии имеет следующий вид:Y = 57,933 – 14,333X₁ + 29X₂Кроме того, по результатам t-статистики предиктор Х₁ является статистически не значимым, поскольку 0,104>0,05. Значит, только переменная Х₂ объясняет долю вариации оценки качества. Сводка для моделиМодельRR КвадратСкоррект. R КвадратСтанд. ошибка оценки1,923a,853,8039,18235a. Предикторы: (Константа), Х2, Х1Таблица дисперсионного анализа ANOVAbМодельСумма квадратовdfСредний квадратFЗнач.1Регрессия2924,22221462,11117,341,003aОстаток505,893684,316Всего3430,1168a. Предикторы: (Константа), Х2, Х1b. Зависимая переменная: средний показатель качества сырьяКоэффициентыaМодельНестандарт. коэффициентыСтандарт. коэффициентыtЗнач.BСт. ошибкаBeta1(Константа)57,9335,30110,928,000Х1-14,3337,497-,346-1,912,104Х229,0007,497,7003,868,008a. Зависимая переменная: средний показатель качества сырья в ячейке4) Значения F-теста, полученного из регрессионного анализа, и F-теста, полученного из однофакторного дисперсионного анализа абсолютно аналогичны (F=17,341). Это можно объяснить тем, что дисперсионный анализ представляет собой выявления влияния на изучаемый показатель некоторых факторов, не поддающихся количественному измерению или описанию. Но в уравнение регрессии также можно включать количественные факторы, путем включения фиктивных переменных, что мы и проделали.5) Сравним коэффициенты регрессии с разностями средних значений оценок качества для разных поставщиков.Константа уравнения регрессии составляет 57,933, что совпадает со средним значением оценки для поставщика С, поскольку в этом случае все значения фиктивных (Х1 ,Х2) переменных будут равны нулю.Сумма константы и коэффициента при переменной Х1 отражает средний уровень оценки для поставщика А: 57,933 – 14,333 = 43,6.Сумма константы и коэффициента при переменной Х2 отражает средний уровень оценки для поставщика В: 57,933 + 29 = 86,933.6) Представим данные в среде spss в нужном для проведения двухфакторного дисперсионного анализа виде. 6286576835Критерий Левенэ проверки равенства дисперсийЗависимая переменная:ОценкаFdf1df2Знач.1,292836,278Оценка эффектов межгрупповых факторовЗависимая переменная: ОценкаИсточникСумма квадратов типа IIIdfСредний квадратFЗнач.Скоррект. модель17150,578a82143,82254,198,000Свободный член177598,4221177598,4224489,848,000Поставщик14621,11127310,556184,817,000Смена1910,1782955,08924,146,000Поставщик * Смена619,2894154,8223,914,010Ошибка1424,0003639,556Итого196173,00045Скоррект. итог18574,57844a. R Squared = ,923 (Adjusted R Squared = ,906)По результатам проведенного дисперсионного анализа можно сказать о том, что модель, в целом, значима, поскольку p-value = 0,00 (<0,05). Кроме того, тест Левенэ подтвердил выполнение допущения к модели, показывая, что дисперсии для каждой из групп статистически достоверно не различаются (0,278>0,05). Следовательно, результаты ANOVA могут быть признаны достоверными. Все факторы оказались значимо влияющими на оценку качества сырья.843915547370Для наглядности построим график средней оценки качества в зависимости от смены работы опрашиваемых и поставщика:Поставщик Bipolar занимает лидирующее положение, в то время как Amalgamated имеет самые низкие оценки по сменам. Работники дневной смены давали наивысшие оценки поставщикам, самые низкие оценки давали работники ночной смены предприятия.Задача № 26.Объедините размеры годовой заработной платы в три группы всоответствии с уровнем квалификации служащих ( А, В и С) иДля сравнения этих трех групп постройте блочные диаграммы и прокомментируйте их.Найдите среднее значение для каждого уровня квалификации и прокомментируйте его.Найдите межгрупповую и внутригрупповую вариацию и соответствующие им степени свободы.Найдите значение F — статистики и количество степеней свободы для нее.Выполните F — тест на уровне 0,05 и представьте результаты.Изложите результаты теста наименьшего значимого различия, если он может быть применен (тест наименьшего значимого различия - в точности то же, что и предусмотренный в SPSS сравнительный анализ влияния различных уровней фактора на исследуемый признак, см. Лекцию 2, стр.18 и примеры из Case Studies в SPSS).Обобщите, что вы узнали из базы данных относительно этой проблемы.Решение.Заносим необходимые данные в spss из исходных данных «БД служащих». 469900-381030956251334135Далее строим блочные диаграммы. Можно сказать, что данные в каждой группе нормально не распределены. Уровни заработных плат у людей с разными уровнями квалификации различны. Служащие, имеющие квалификацию А, в среднем зарабатывают меньше всех. Тем не менее, в этом уровне присутствует явный выброс – сотрудник с уровнем з/п около 250 000 долларов в год. У группы служащих с уровнем квалификации В в среднем размах меньше и зарплата чуть выше. В группе C зарплата еще выше и изменяется в интервале от 50 до 60 тыс. $.-646430107315С изменением уровня профессиональной подготовки средняя заработная плата изменяется и справедливо следующее соотношение: А < B < C.КвалификацияСреднееNСт. откл.с выбросомA46752,163834647,766B48383,04248216,484C53926,8993451,407Всего48212,927125757,377КвалификацияСреднееNСт.откл.без выбросаA41434,053711368,197B48383,04248216,484C53926,8993451,407Всего45422,797010598,329Для нахождения межгрупповой и внутригрупповой вариации и соответствующие числа степеней свободы необходимо построить таблицу дисперсионного анализа ANOVA.Выбираем: Анализ – Сравнение средних – Однофакторный дисперсионный анализ.Таблица дисперсионного анализа (с выбросом)Сумма квадратовст.св.Средний квадратFЗнач.Между группами3,756E821,878E8,277,759Внутри групп4,607E10686,774E8Итого4,644E1070Таблица дисперсионного анализа (без выброса)Сумма квадратовст.св.Средний квадратFЗнач.Между группами1,450E927,249E87,709,001Внутри групп6,301E9679,404E7Итого7,750E969 Межгрупповая вариация:SSA₁= 3,756E8; dfA1=2SSA₂= 1,450E9; dfA2=2Внутригрупповая вариация:SSW₁=4,607E10; dfW1=68SSW₂=6,301E9; dfW2=67При проведении теста на значимость модели в целом (влияет ли изменение уровня квалификации на величину зарплаты), мы получили значение F-статистики=0,277 (7,709 – во 2 модели), с количеством степеней свободы (2,68)(2, 67). Fкрит. = 3,07, следовательно: модель 1 статистически незначима, модель 2 – значима.На уровне значимости 0,05 модель 1 не значима (0,759›0,05), значит, мы делаем вывод о том, что изменение уровня квалификации статистически значимо не влияет на величину заработной платы (нет оснований опровергать нулевую гипотезу: уровень подготовки значимо не влияет на уровень заработной платы сотрудника)Критерий однородности дисперсий в модели 1Критерий однородности дисперсий в модели 2Статистика Левенэст.св.1ст.св.2Знач.Статистика Левенэст.св.1ст.св.2Знач.1,5222680,22611,1242670,00При проведении теста Левенэ на однородность дисперсии, мы выяснили, что допущение модели не выполняется в модели 2, дисперсия оказалась неоднородной (0,00<0,05). Одно из допущений к модели не выполняется, значит, при статистической значимости модели делаем вывод, что модель неадекватно описывает ситуацию.Следовательно, обе модели неадекватно описывают ситуацию.Тест наименьшего значимого различия не может быть проведен, так как значение F-теста оказалось незначимым, следовательно, t-тест также будет незначимо отличаться от 0.В ходе проведенного анализа, мы смогли узнать о том, что размер годовой заработной платы не зависит от уровня подготовки сотрудника.Средние значения годовой заработной платы незначительно варьируются от А к ССледовательно, руководству компании стоит пересмотреть свою кадровую политику и провести квалификационные тестирования для определения реального уровня знаний сотрудников.Задача № 35.Представьте себе, что данные в однофакторном экспериментераспределены по четырем группам, каждая из которых состоитиз восьми элементов.Заполните пропуски в приводимой ниже сводной таблице ANOVA, объяснив, чем в ней являются величины c и n .Вид вариативностиКоличество степеней свободыСумма квадратовДисперсияF — статистикаМежгрупповая вариативность признакаc -1 = ?SSA = ?MSA = 80F = ?Внутригрупповая вариативность признакаn - c = ?SSW = 560MSW = ?Полная вариативность признакаn -1 = ?SST = ?Решение.В данной задаче под с представляется число уровней модели, равное по условию задачи 4 группам, а в качестве n подразумевается общее число наблюдений, соответственно равное 32, исходя из того, что в однофакторном эксперименте данные были распределены на 4 группы по 8 элементов.Вид вариативностиКоличество степеней свободыСумма квадратовДисперсияF — статистикаМежгрупповая вариативностьпризнакаc – 1 = 4 - 1 = 3SSA = MSA*dfA= 80*3 = 240MSA = 80F = MSA/MSW = 80/20 = 4Внутригрупповая вариативностьпризнакаn – c = 32 - 4 = 28SSW = 560MSW = SSW/dfW= 560/28 = 20Полная вариативность признакаn – 1 = 32 - 1 = 31SST = SSA+SSW = 240+560 = 800Задача № 42.☼ Компания, производящая шариковые авторучки, наняла рекламное агентство, чтобы организовать общенациональную рекламную кампанию. Для начала директор компании решил исследовать влияние рекламы на восприятие их продукции. Был организован эксперимент, в котором сравнивались пять видов рекламы шариковых авторучек. В рекламе А свойства авторучек были сильно занижены, в рекламе Б — занижены умеренно, в рекламе В — слегка преувеличены, в рекламе Г — сильно преувеличены, и лишь в рекламе Д характеристики ручек описывались объективно. Из крупной фокус - группы была извлечена выборка, в которую были включены 30 респондентов, случайным образом распределенные по пяти группам, соответствующим разным видам рекламы (по шесть человек в группе). Прочитав рекламное объявление и сформировав свое представление о продукции компании, респонденты получали авторучки одного и того же вида, испытывали их и оценивали достоверность рекламных обещаний. Респондентов просили оценить внешний вид, долговечность и качество авторучек по семибалльной шкале. Суммарный рейтинг рекламы, учитывающий баллы по каждому из показателей (внешний вид, долговечность и качество), поставленные каждым из 30 респондентов, приведены в файле ☼ PEN . XLS.Существует ли статистически значимая разница между средними рейтингами разных рекламных объявлений, если уровень значимости равен 0,05?Определите, рейтинг какого рекламного объявления отличается от среднего, если это возможно.Существует ли статистически значимая разница между дисперсиями рейтингов разных рекламных объявлений, если уровень значимости равен 0,05?Как результат решения пункта 3 влияет на корректность результатов решения пунктов 1 и 2?Решение.Построим таблицу дисперсионного анализа.Анализ – Сравнение средних – Однофакторный дисперсионный анализ.Таблица дисперсионного анализа ANOVAрейтингСумма квадратовст.св.Средний квадратFЗнач.Между группами377,867494,46712,562,000Внутри групп188,000257,520Итого565,86729Осуществить проверку статистической значимости разницы между средними рейтингами разных рекламных объявлений можно с помощью процедуры проведения F-теста:В таблице дисперсионного анализа мы видим его значение: F=12,562 при наблюденной значимости 0,00 < 0,05 F-тест значим, следовательно, у нас нет оснований к принятию гипотезы H0: средние значения всех генеральных совокупностей равны между собой, то есть можно сделать вывод о том, что существует статистически значимая разница между средними рейтингами рекламных объявлений.Построим график средних.Графика – Линии – Простая/Итоги по группам наблюдений – Другую статистику (например, среднее).Судя по графику, реклама с сильно преувеличенными свойствами товара имеет самый низкий рейтинг, следовательно, товаропроизводителю стоит принять к сведению этот психологический аспект восприятия рекламы потребителями. (Потребительские ожидания не соответствуют действительности)30607044450Для того чтобы определить существует ли статистически значимая разница между дисперсиями рейтингов рекламных объявлений, воспользуемся тестом Левенэ:Тест на однородность дисперсийРейтингСтатистика Левенэdf1df2Знач.2,284425,089H0: дисперсии генеральных совокупностей для всех групп одинаковыP=0,089 (0,089 > 0,05), следовательно, у нас нет оснований для опровержения гипотезы H0. Следовательно, можно провести один из апостериорных тестов (Шеффе) для более полного анализа методом множественных сравнений. Основываясь на данных, приведенных в таблице ниже, мы можем говорить о том, что тип рекламы А отличается от типов В и Г; тип рекламы Б отличается от типов В и Г; тип рекламы В отличается от типов А и Б; тип рекламы Г отличается от типов А, Б и Д; тип рекламы Д отличается от типа рекламы Г.Множественные сравнения(I) Реклама(J) Реклама(I-J)-я разность среднихСт.ошибкаЗнач.95% Доверительный интервалНижняя границаВерхняя границаАБ,3331,5831,000-4,935,59В6,667*1,583,0081,4111,93Г9,000*1,583,0003,7414,26Д2,6671,583,593-2,597,93БА-,3331,5831,000-5,594,93В6,333*1,583,0121,0711,59Г8,667*1,583,0003,4113,93Д2,3331,583,706-2,937,59ВА-6,667*1,583,008-11,93-1,41Б-6,333*1,583,012-11,59-1,07Г2,3331,583,706-2,937,59Д-4,0001,583,206-9,261,26ГА-9,000*1,583,000-14,26-3,74Б-8,667*1,583,000-13,93-3,41В-2,3331,583,706-7,592,93Д-6,333*1,583,012-11,59-1,07ДА-2,6671,583,593-7,932,59Б-2,3331,583,706-7,592,93В4,0001,583,206-1,269,26Г6,333*1,583,0121,0711,59*. Разность средних значима на уровне 0.05.Исходя из того, что тест Левенэ оказался значимым, мы сделали вывод о том, что дисперсии рейтингов разных рекламных сообщений равны, следовательно, результаты проведенного анализа корректны.Задача № 44.Компания, производящая спортивные товары, желает сравнить расстояние, которое пролетают мячи для гольфа, изготовленные по четырем разным технологиям. По каждой технологии было произведено по десять мячей. Затем эти мячи были переданы местному гольф-клубу для испытаний. Порядок следования мячей был случайным. Все 40 мячей были испытаны в течение короткого отрезка времени при одинаковых погодных условиях.
Список литературы
лекции
Пожалуйста, внимательно изучайте содержание и фрагменты работы. Деньги за приобретённые готовые работы по причине несоответствия данной работы вашим требованиям или её уникальности не возвращаются.
* Категория работы носит оценочный характер в соответствии с качественными и количественными параметрами предоставляемого материала. Данный материал ни целиком, ни любая из его частей не является готовым научным трудом, выпускной квалификационной работой, научным докладом или иной работой, предусмотренной государственной системой научной аттестации или необходимой для прохождения промежуточной или итоговой аттестации. Данный материал представляет собой субъективный результат обработки, структурирования и форматирования собранной его автором информации и предназначен, прежде всего, для использования в качестве источника для самостоятельной подготовки работы указанной тематики.
Другие контрольные работы
bmt: 0.00536