Вход

Общая теория статистики, вариант 10

Рекомендуемая категория для самостоятельной подготовки:
Контрольная работа*
Код 358957
Дата создания 09 апреля 2013
Страниц 19
Мы сможем обработать ваш заказ (!) 23 декабря в 16:00 [мск]
Файлы будут доступны для скачивания только после обработки заказа.
1 150руб.
КУПИТЬ

Описание

Задания
1. Используя базу данных официального сайта www.gks.ru , сформировать массив значений признака Y согласно выбранному варианту по всем субъектам РФ за последний опубликованный год. Оценить однородность совокупности с помощью коэффициента вариации и произвести проверку на нормальность распределения с помощью правила «трёх сигм». В случае наличия резко выделяющихся значений, исключить эти субъекты из массива для проведения более объективного дальнейшего исследования.
2. Построить ряд распределения по сформированному массиву значений признака Y, рассчитав число групп по формуле Стерджесса.
Для построенного ряда определить показатели центра распределения, показатели вариации, дифференциации, формы распределения. Дать графическое определение Моды и Медианы.
3.В соответствии с распределен ...

Содержание

Задания
1. Используя базу данных официального сайта www.gks.ru , сформировать массив значений признака Y согласно выбранному варианту по всем субъектам РФ за последний опубликованный год. Оценить однородность совокупности с помощью коэффициента вариации и произвести проверку на нормальность распределения с помощью правила «трёх сигм». В случае наличия резко выделяющихся значений, исключить эти субъекты из массива для проведения более объективного дальнейшего исследования.
2. Построить ряд распределения по сформированному массиву значений признака Y, рассчитав число групп по формуле Стерджесса.
Для построенного ряда определить показатели центра распределения, показатели вариации, дифференциации, формы распределения. Дать графическое определение Моды и Медианы.
3.В соответствии с распределением субъектов РФ по федеральным округам (Центральный, Северо-Западный, Приволжский и т.д.,) построить аналитическую группировку (факторный признак – федеральный округ, результативный признак – Y). По результатам группировки выполнить анализ по следующим направлениям:
 сравнить средние значения признака Y в отдельных федеральных округах со средним значением по РФ в целом;
 сравнить федеральные округа друг с другом по степени однородности распределения исследуемого признака Y.
Сформулировать вывод о различиях в социально-экономическом положении регионов России по исследуемому признаку Y
4.Используя правило сложения дисперсий применительно к данным, полученным в п. 4, определить долю вариации признака Y, обусловленную территориальным фактором. Измерить тесноту связи между факторами с помощью эмпирического корреляционного отношения.

Признак: Потребление картофеля на душу населения (Рег Р-5

Введение

Задания
1. Используя базу данных официального сайта www.gks.ru , сформировать массив значений признака Y согласно выбранному варианту по всем субъектам РФ за последний опубликованный год. Оценить однородность совокупности с помощью коэффициента вариации и произвести проверку на нормальность распределения с помощью правила «трёх сигм». В случае наличия резко выделяющихся значений, исключить эти субъекты из массива для проведения более объективного дальнейшего исследования.
2. Построить ряд распределения по сформированному массиву значений признака Y, рассчитав число групп по формуле Стерджесса.
Для построенного ряда определить показатели центра распределения, показатели вариации, дифференциации, формы распределения. Дать графическое определение Моды и Медианы.
3.В соответствии с распределен ием субъектов РФ по федеральным округам (Центральный, Северо-Западный, Приволжский и т.д.,) построить аналитическую группировку (факторный признак – федеральный округ, результативный признак – Y). По результатам группировки выполнить анализ по следующим направлениям:
 сравнить средние значения признака Y в отдельных федеральных округах со средним значением по РФ в целом;
 сравнить федеральные округа друг с другом по степени однородности распределения исследуемого признака Y.
Сформулировать вывод о различиях в социально-экономическом положении регионов России по исследуемому признаку Y
4.Используя правило сложения дисперсий применительно к данным, полученным в п. 4, определить долю вариации признака Y, обусловленную территориальным фактором. Измерить тесноту связи между факторами с помощью эмпирического корреляционного отношения.

Признак: Потребление картофеля на душу населения (Рег Р-5

Фрагмент работы для ознакомления

Новгородская область
132
Челябинская область
133
Орловская область
139
Алтайский край
143
Хабаровский край
143
Карачаево-Черкесская Республика
145
Амурская область
145
Республика Татарстан
151
Республика Алтай
156
Республика Марий Эл
163
Брянская область
164
Еврейская автономная область
180
Чувашская Республика
188
Красноярский край
202
Определим однородность совокупности с помощью коэффициента вариации, который рассчитываем по формуле:
Среднее и среднее квадратическое отклонение были найдены с помощью инструмента анализа «Описательная статистика» программы MS Excel.
Так как V 33%, то по изучаемому признаку расхождения между значениями признака не велико, следовательно, можно сделать вывод об однородности совокупности.
Сделаем проверку на нормальность распределения с помощью правила «трёх сигм».
Для оценки количества попаданий индивидуальных значений признаков xi в тот или иной диапазон отклонения от средней , а также для выявления структуры рассеяния значений xi по 3-м диапазонам сформируем табл. 3.
Таблица 3
Распределение значений признака по диапазонам рассеяния признака относительно
Границы диапазонов, руб.
Количество значений xi, находящихся в диапазоне
Процентное соотношение рассеяния значений xi по диапазонам, %
[76,46;138,54]
56
70,00
[45,42;169,58]
76
95,00
[14,38;200,62]
79
98,75
На основе данных табл. 3 структура рассеяния значений признака по трем диапазонам сопоставляется со структурой рассеяния по правилу «трех сигм», справедливому для нормальных и близких к нему распределений:
70,00% значений располагаются в диапазоне (),
95,00% значений располагаются в диапазоне (),
98,75% значений располагаются в диапазоне ().
Аномальным наблюдением является Красноярский край, его исключаем из дальнейшего исследования.
Сравнение данных графы 4 табл. 3 с правилом «трех сигм» показывает на их незначительное расхождение, следовательно, распределение единиц совокупности по признаку можно считать близким к нормальному.
2.Теперь, чтобы произвести группировку данных нужно просчитать величину интервала, который определяется по формуле:
,
Значение величины интервала (h) округляется.
Оптимальное число групп (n) может определяется по формуле Стерджесса: , где N - число единиц в совокупности. В нашем случае N=79.
Значение числа групп (n) тоже округляется.
В результате проведенной группировки, получили следующую таблицу:
Таблица 4.
Интервал
Количество субъектов
Удельный вес, %
44-64,57
6
7,6
64,57-85,14
12
15,2
85,14-105,71
25
31,6
105,71-126,29
19
24,1
126,29-146,86
11
13,9
146,86-167,43
4
5,1
167,43-188
2
2,5
Итого:
79
100,0
Согласно результатам полученной группировки в большинстве субъектов РФ имеют потребление картофеля от 85,14 кг до 105,71 кг (31,6%).
Построим графики.
Охарактеризуем ряд распределения с помощью системы показателей центра и формы распределения, вариации признака.
Первоначально рассчитаем показатели моды и медианы.
Конкретное значение моды для интервального ряда рассчитывается по формуле:
где хМo – нижняя граница модального интервала,
h –величина модального интервала,
fMo – частота модального интервала,
fMo-1 – частота интервала, предшествующего модальному,
fMo+1 – частота интервала, следующего за модальным.
Согласно табл. 4 модальным интервалом построенного ряда является интервал 85,14 кг – 105,71 кг, так как его частота максимальна (f3 = 25).
Расчет моды по формуле:
кг.
Для рассматриваемой совокупности наиболее распространенный уровень потребления картофеля характеризуется средней величиной 99,21 кг в год.
Конкретное значение медианы для интервального ряда рассчитывается по формуле:
,
где хМе – нижняя граница медианного интервала,
h – величина медианного интервала,
– сумма всех частот,
fМе – частота медианного интервала,
SMе-1 – кумулятивная (накопленная) частота интервала, предшествующего медианному.
Для расчета медианы необходимо, прежде всего, определить медианный интервал, для чего используются накопленные частоты (или частости). Так как медиана делит численность ряда пополам, она будет располагаться в том интервале, где накопленная частота впервые равна полусумме всех частот или превышает ее (т.е. все предшествующие накопленные частоты меньше этой величины).
В нашем случае медианным интервалом является интервал 85,14-105,71 кг, так как именно в этом интервале накопленная частота Sj = 6+12+25=43 впервые превышает величину, равную половине численности единиц совокупности (=).
Расчет значения медианы по формуле:
кг.
В рассматриваемой совокупности половина наблюдений имеют потребление картофеля не более 102,83 кг, а другая половина – не менее 102,83 кг.
Для расчета остальных показателей построим вспомогательную таблицу.
Таблица 5
Вспомогательная таблица
Интервал
Число наблюдений
Середина интервала
44-64,57
6
54,29
325,71
15470,17
-785538
39887713,2
64,57-85,14
12
74,86
898,29
10948,94
-330725
9989934,62
85,14-105,71
25
95,43
2385,71
2320,70
-22359,3
215425,122
105,71-126,29
19
116,00
2204,00
2272,62
24854,99
271831,765
126,29-146,86
11
136,57
1502,29
10920,39
344081,1
10841356,1
146,86-167,43
4
157,14
628,57
10849,12
565017,7
29425877,1
167,43-188
2
177,71
355,43
10556,33
766928,2
55718094
Итого:
79
8300,00
63338,28
562259,6
146350232
Размах вариации:
кг.
Расчет средней арифметической взвешенной:
кг
Расчет среднего квадратического отклонения:

Расчет дисперсии:
σ2 =28,322= 801,75.
Расчет коэффициента вариации:
Анализ полученных значений показателей и σ говорит о том, что средний уровень потребления картофеля составляет 105,06 кг, отклонение от среднего в ту или иную сторону составляет в среднем 28,32 кг (или 26,95%).
Значение Vσ = 26,95% не превышает 33%, следовательно, вариация в исследуемой совокупности не значительна и совокупность по данному признаку однородна. Расхождение между значениями , Мо и Ме незначительны, что подтверждает вывод об однородности совокупности. Таким образом, найденное среднее значение (105,06 кг) является типичной и надежной характеристикой исследуемой совокупности.
Определим коэффициент асимметрии.
,
- центральный момент третьего порядка
Средняя квадратическая ошибка:
, n – число наблюдений
Так как, , асимметрия не существенна.
Определим эксцесс.
,
- центральный момент четвертого порядка
Так как, <0 – распределение не островершинное.
3. Используя данные п. 1, сгруппируем субъекты РФ по принадлежности к федеральным округам. По каждой группе определим среднее значение изучаемого признака.
Результаты группировки представим в виде табл. 6.
Таблица 6
Группировка субъектов РФ по территориальному признаку
Федеральный округ
Число субъектов
Наименование субъекта
Потребление картофеля, кг
Среднее значение признака по федеральным округам
Центральный
18
Белгородская область
104
108,6
Брянская область
164
Владимирская область
121
Воронежская область
110
Ивановская область
70
Калужская область
112
Костромская область
103
Курская область
125
Липецкая область
112
Московская область
101
Москва
61
Орловская область
139
Рязанская область
102
Смоленская область
95
Тамбовская область
122
Тверская область
99
Тульская область
125
Ярославская область
90
Северо-Западный
10
Республика Карелия
102
85,9
Республика Коми
56
Архангельская область
74
Вологодская область
86
Калининградская область
114
Ленинградская область
85
Мурманская область
66
Новгородская область
132
Санкт-Петербург
68
Псковская область
76
Южный
6
Республика Адыгея
61
88,0
Республика Калмыкия
44
Краснодарский край
84
Астраханская область
116
Волгоградская область
131
Ростовская область
92
Северо-Кавказский
7
Республика Дагестан
88
106,6
Республика Ингушетия
113
Кабардино-Балкарская Республика
118
Карачаево-Черкесская Республика
145
Республика Северная Осетия-Алания
96
Чеченская Республика
70
Ставропольский край
116
Приволжский
14
Республика Марий Эл
163
112,0
Республика Мордовия
102
Удмуртская Республика
130
Республика Татарстан
151
Республика Башкортостан
87
Чувашская Республика
188
Пермский край
105
Кировская область
89
Нижегородская область
98
Оренбургская область
78
Пензенская область
124
Самарская область
105
Саратовская область
53
Ульяновская область
95
Уральский
4
Курганская область
90
103,3
Свердловская область
89
Тюменская область
101
Челябинская область
133
Сибирский
12
Республика Алтай
156

Список литературы

-
Очень похожие работы
Найти ещё больше
Пожалуйста, внимательно изучайте содержание и фрагменты работы. Деньги за приобретённые готовые работы по причине несоответствия данной работы вашим требованиям или её уникальности не возвращаются.
* Категория работы носит оценочный характер в соответствии с качественными и количественными параметрами предоставляемого материала. Данный материал ни целиком, ни любая из его частей не является готовым научным трудом, выпускной квалификационной работой, научным докладом или иной работой, предусмотренной государственной системой научной аттестации или необходимой для прохождения промежуточной или итоговой аттестации. Данный материал представляет собой субъективный результат обработки, структурирования и форматирования собранной его автором информации и предназначен, прежде всего, для использования в качестве источника для самостоятельной подготовки работы указанной тематики.
bmt: 0.00348
© Рефератбанк, 2002 - 2024