Вход

Анализ эмпирического распределения

Рекомендуемая категория для самостоятельной подготовки:
Курсовая работа*
Код 283005
Дата создания 06 октября 2014
Страниц 45
Мы сможем обработать ваш заказ (!) 25 ноября в 12:00 [мск]
Файлы будут доступны для скачивания только после обработки заказа.
1 600руб.
КУПИТЬ

Описание

Заключение

Выполнив данную курсовую работу, я, освоил конкретные методы статистического анализа с использованием пакета прикладных программ STATISTICA На конкретном примере подробно был рассмотрен блок программ, обеспечивающий решение таких важных в статистической практике задач, как анализ эмпирических распределений.
В работе был проведен анализ эмпирического распределения ручным способом и при помощи программы STATISTICA, и проведено сравнение полученных показателей распределения.
При расчете среднего арифметического значения вручную и с помощью программы STATISTICA, было обнаружено, что значение показателей отличаются. Это происходит, потому что единицы статистической совокупности теряют свою численную идентичность при переходе от не сгруппированных исходных данных к интервальному ряд ...

Содержание

Содержание:
Введение 3
1. Ручная обработка статистических данных 4
2. Компьютерная обработка статистических данных 10
Заключение 26


Введение

Введение

Целью работы является освоение методики и приобретение практических навыков анализа распределений, включающего расчет основных статистических характеристик, графическое и табличное представление рядов распределения, аппроксимацию эмпирического распределения, подбор модельного распределения с использованием критериев согласия.

Фрагмент работы для ознакомления

282,7
294,2
212,4
229,9
241,1
247,9
253,8
259,8
263,5
272,2
285,2
295,5
213
230,3
241,4
248,2
253,9
260
264
272,7
285,3
296,4
213,4
230,4
241,4
248,6
254,2
260,1
264,7
272,8
286,4
297
215,3
230,7
243,4
248,8
254,5
260,1
265,1
273,1
287
298
216,3
233,4
244
248,9
254,6
260,2
265,3
273,4
287,6
298
216,9
233,9
244
249
255,1
260,3
265,5
273,9
287,7
299
216,9
234,6
244,1
249,2
255,5
260,3
266,6
274,6
287,8
300,2
219,1
235,1
244,7
249,5
256,3
260,6
267,1
275,1
288,8
300,2
222,3
235,2
244,7
249,6
256,6
260,6
267,7
275,4
289,2
301
223,7
235,9
245
250,1
257,3
261,2
267,8
275,6
290,1
304,1
225,1
236,6
245,1
250,4
257,5
261,2
267,9
275,7
290,5
306,8
225,5
237,6
245,1
251,1
257,9
261,3
268
275,7
290,6
307,5
226
237,7
245,3
251,8
257,9
261,3
268,3
276,2
291
308,8
226,9
238,4
245,3
252,2
258,4
261,3
269,3
276,9
291,3
309,1
227
238,5
245,4
252,3
258,5
261,3
270,9
278,4
292,4
309,9
227,3
238,6
245,5
252,4
258,6
261,9
270,9
281,3
293,1
313,6
227,5
239,6
245,6
252,4
259
262,6
271,2
282
293,3
319,6
228,9
240,2
246,3
252,5
259,3
262,7
271,2
Таблица 5
Основные характеристики распределения
Valid N
197
Mean
100
Confidence
259,382234
Confidence
256,006758
Geometric
262,757709
Harmonic
259,324294
Median
259,519797
Mode
2,79239873
Frequency
0,954069056
Sum
258,271886
Minimum
257,15628
Maximum
259
Lower
261,3000
Upper
4
Percentile
51098,3
Percentile
192,3
Range
319,6
Quartile
244,7
Variance
273,9
Coef.Var.
228,9
Std.Dev.
293,3
Standard
127,3
Skewness
29,2
Std.Err.
577,112081
Kurtosis
24,0231572
Std.Err.
21,862128
Приведем формулы полученных статистических характеристик:
Valid N — объем выборки (число единиц в совокупности).
Mean — средняя арифметическая:
,
где - значение признака у i-й единицы совокупности;
n – объем совокупности (Valid N).
= 18388,2/140 = 131,3443
Geometric mean — геометрическая средняя:
.
Median — медиана:
, если n — четное, Me = (131+131,3)/2 = 131,15
, если n — нечетное.
Mode —мода (Мо ) определяется непосредственно по исходным данным.
Frequency – частота модального значения.
Sum — сумма значение признака в совокупности: .
Variance — дисперсия: ,
где - средняя арифметическая.
Coef.Var. – коэффициент вариации: .
Standard deviation — среднеквадратическое (стандартное) отклонение:
.
Standard (Standard error) — средняя (стандартная) ошибка выборки:
.
Minimum — минимальное значение признака в совокупности: Xmin .
Maximum — максимальное значение признака в совокупности: Xmax.
Range — размах вариации: R = Xmax – Xmin.
Lower (Lower quartile) — нижний (первый) квартиль:
= (114,5+114)/2 = 114,25
, ,
где floor — округление до ближайшего целого;
ceiling — округление до ближайшего большего.
Upper (Upper quartile) — верхний (третий) квартиль:
,
= (149,2+149,1)/2 = 149,15
, .
Quartile (Interquartile range) — межквартильный размах: Q3 – Q1.
Skewness — асимметрия:
.
Std.err. (Standardized skewness) — стандартизованная асимметрия:
σAs=√6∕n; tAs = As / σAs
Kurtosis — коэффициент эксцесса (куртозис):
.
Std.err. (Standardized kurtosis) — стандартизованный куртозис.
σEx = √24∕n ; tEx = Ex / σEx
Основные характеристики распределения представлены в таблице 6.
Таблица 6
Сравнение статистических показателей, рассчитанных различными способами

Название показателя
Значение в ППП STATISTICA
Значение после ручного расчета
1
Среднее арифметическое
259,382
259,34
2
Дисперсия
577,112
579,4
3
Среднеквадратическое отклонение
24,0232
24,07
4
Мода
261,300
266,05
5
Медиана
259
277,5
6
Нижний квартиль
244,7
262,18
7
Верхний квартиль
273,9
298,84
Из таблицы 5 видно, что значения показателей, рассчитанные ручным способом, отличаются от показателей, рассчитанных компьютером. Это происходит, потому что переход от не сгруппированных исходных данных к интервальному ряду распределения объективно вносит погрешность в расчеты, которые делаются на основе таблицы распределения. Источником погрешности является то, что варианты, попавшие в i – ый интервал, заменяются значением его середины Xi.
Таблица 7
Таблица вариационного ряда, построенная с использованием числа интервалов, к=8
From to
Count
Cumulative Count
Percent
Cumulative Percent
160,0000<x<=180,0000
0,00000
0,0000
180,0000<x<=200,0000
1
1
0,50761
0,5076
200,0000<x<=220,0000
9
10
4,56853
5,0761
220,0000<x<=240,0000
29
39
14,72081
19,7970
240,0000<x<=260,0000
65
104
32,99492
52,7919
260,0000<x<=280,0000
53
157
26,90355
79,6954
280,0000<x<=300,0000
29
186
14,72081
94,4162
300,0000<x<=320,0000
11
197
5,58376
100,0000
Таблица 8
Таблица вариационного ряда, построенная с использованием числа интервалов, к=10
From to
Count
Cumulative Count
Percent
Cumulative Percent
160,0000<x<=180,0000
0,00000
0,0000
180,0000<x<=200,0000
1
1
0,50761
0,5076
200,0000<x<=220,0000
9
10
4,56853
5,0761
220,0000<x<=240,0000
29
39
14,72081
19,7970
240,0000<x<=260,0000
65
104
32,99492
52,7919
260,0000<x<=280,0000
53
157
26,90355
79,6954
280,0000<x<=300,0000
29
186
14,72081
94,4162
300,0000<x<=320,0000
11
197
5,58376
100,0000
Таблица 9
Таблица вариационного ряда, построенная с использованием числа интервалов, к=19
From to
Count
Cumulative Count
Percent
Cumulative Percent
170,0000<x<=180,0000
0,00000
0,0000
180,0000<x<=190,0000
0,00000
0,0000
190,0000<x<=200,0000
1
1
0,50761
0,5076
200,0000<x<=210,0000
1
2
0,50761
1,0152
210,0000<x<=220,0000
8
10
4,06091
5,0761
220,0000<x<=230,0000
13
23
6,59898
11,6751
230,0000<x<=240,0000
16
39
8,12183
19,7970
240,0000<x<=250,0000
32
71
16,24365
36,0406
250,0000<x<=260,0000
33
104
16,75127
52,7919
260,0000<x<=270,0000
32
136
16,24365
69,0355
270,0000<x<=280,0000
21
157
10,65990
79,6954
280,0000<x<=290,0000
13
170
6,59898
86,2944
290,0000<x<=300,0000
16
186
8,12183
94,4162
300,0000<x<=310,0000
9
195
4,56853
98,9848
310,0000<x<=320,0000
2
197
1,01523
100,0000
В таблицах первая непоименованная графа (From To) содержит интервалы значений признака
в каждой группе;
Count – абсолютные частоты (fi), т.е. число единиц совокупности, обладающих указанным значением признака;
Cumulative Count – накопленные абсолютные частоты, получаемые последовательным суммированием частот по группам. Сумма накопленных частот по каждой строке означает, какое количество единиц совокупности имеет значение признака, не превышающее значения верхней границы данного интервала. Общая сумма накопленных частот соответствует объему изучаемой совокупности (125);
Percent – частости (относительные частоты, Wi), рассчитываются:
Wi = ,
где - число единиц i-й группы;
- общее число единиц в совокупности.
Wi – доля каждой группы в общем объеме совокупности, т.е. процент элементов, в которых значение признака находится в пределах данного интервала;
Cumulative percent – накопленные частности – это результат последовательного суммирования относительных частот по группам, итоговая сумма, следовательно, равна 100%.
Традиционно для изображения вариационных рядов распределения в отечественной практике используются графики: гистограмма, кумулята, полигон (рис. 2-9).
Рис. 2. Полигон распределения в абсолютных частотах (k=19)
Рис. 3. Полигон распределения в абсолютных частотах (k=10)
Рис. 4. Полигон распределения в абсолютных частотах (k=8)
Рис. 5. Кумулята распределение в абсолютных частотах (k=19)
Рис. 6. Кумулята распределение в относительных частотах (k=19)
Рис. 7. Гистограмма распределение с наложенной на нее кривой нормального распределения: с числом интервалов (k=8)
Рис. 8. Гистограмма распределение с наложенной на нее кривой нормального распределения: с числом интервалов (k=10)
Рис. 9. Гистограмма распределение с наложенной на нее кривой нормального распределения: с числом интервалов (k=19)

Список литературы

Источников нет
Очень похожие работы
Найти ещё больше
Пожалуйста, внимательно изучайте содержание и фрагменты работы. Деньги за приобретённые готовые работы по причине несоответствия данной работы вашим требованиям или её уникальности не возвращаются.
* Категория работы носит оценочный характер в соответствии с качественными и количественными параметрами предоставляемого материала. Данный материал ни целиком, ни любая из его частей не является готовым научным трудом, выпускной квалификационной работой, научным докладом или иной работой, предусмотренной государственной системой научной аттестации или необходимой для прохождения промежуточной или итоговой аттестации. Данный материал представляет собой субъективный результат обработки, структурирования и форматирования собранной его автором информации и предназначен, прежде всего, для использования в качестве источника для самостоятельной подготовки работы указанной тематики.
bmt: 0.00684
© Рефератбанк, 2002 - 2024