Министерство образования и науки Российской Федерации
Алтайский государственный технический университет им. И.И. Ползунова
Кафедра высшей математики и математического моделирования
Типовой расчет по математической статистике
(вариант № 12)
Выполнил: ст. гр. ЭУП-41
Козлов А.В.
Проверил: Зайцев В.П.
Барнаул 2006
1. Сформируем выборку объема n = 50 из генеральной совокупности (X, Y), представленной в таблице П4 приложения. Для этого воспользуемся таблицей из 50-ти случайных чисел, полученных с помощью датчика случайных чисел. Эти числа указывают номера элементов, которые будут взяты из генеральной совокупности:
Таблица 1 (таблица случайных чисел)
40 |
85 |
57 |
45 |
94 |
84 |
38 |
38 |
17 |
42 |
58 |
67 |
79 |
26 |
78 |
90 |
60 |
28 |
47 |
47 |
71 |
54 |
23 |
54 |
7 |
74 |
46 |
19 |
39 |
59 |
9 |
54 |
16 |
24 |
99 |
83 |
75 |
98 |
52 |
46 |
20 |
46 |
2 |
5 |
85 |
61 |
59 |
19 |
39 |
51 |
Таблица 2 (выборочная совокупность)
xi |
yi |
xi |
yi |
xi |
yi |
xi |
yi |
xi |
yi |
65,2 |
162 |
65,1 |
158 |
56,2 |
162 |
61,0 |
161 |
51,2 |
153 |
65,5 |
171 |
61,8 |
157 |
54,8 |
159 |
54,8 |
159 |
55,9 |
168 |
51,6 |
156 |
56,9 |
166 |
70,9 |
179 |
60,9 |
165 |
55,3 |
165 |
60,8 |
177 |
71,4 |
171 |
54,8 |
159 |
57,4 |
160 |
57,2 |
154 |
71,9 |
168 |
63,7 |
169 |
60,5 |
159 |
63,3 |
167 |
65,5 |
171 |
75,1 |
183 |
62,4 |
165 |
60,8 |
169 |
60,0 |
171 |
61,9 |
162 |
68,0 |
165 |
63,5 |
167 |
55,9 |
168 |
58,7 |
166 |
67,7 |
169 |
68,0 |
165 |
59,7 |
164 |
62,5 |
161 |
50,1 |
153 |
62,5 |
161 |
62,0 |
165 |
69,0 |
168 |
60,7 |
162 |
52,9 |
159 |
60,7 |
162 |
67,8 |
163 |
69,0 |
168 |
67,7 |
169 |
55,9 |
168 |
60,4 |
162 |
2. Составим группированный ряд для величины Х. Для этого определим наибольшее xmax = 75,1 и наименьшее xmin = 50,1 значения величины X, встречающиеся в выборке. Вычислим размах Rx = xmax – xmin = 75,1 – 50,1 = 25. Весь промежуток разобьем на r = 7 интервалов. Тогда шаг разбиения hx = Rx/r = 25/7 ? 3,571. Для того, чтобы шаг разбиения был удобный, возьмем его равным hx = 4. Тогда расширение промежутка составит:
(4 – 3,571) ? 7 ? 3,003.
Результаты группировки выборочных значений для Х сведем в таблицу 3:
Таблица 3
Номер интервала
i |
Интервалы
[ai-1, ai) |
Середины интервалов
xi* |
Частоты
ni |
Относительные частоты
ni/n |
Накопленные относительные частоты
|
|
1 |
[ 48; 52 ) |
50 |
3 |
0,06 |
0,06 |
0,015 |
2 |
[ 52; 56 ) |
54 |
8 |
0,16 |
0,22 |
0,040 |
3 |
[ 56; 60 ) |
58 |
6 |
0,12 |
0,34 |
0,030 |
4 |
[ 60; 64 ) |
62 |
18 |
0,36 |
0,70 |
0,090 |
5 |
[ 64; 68 ) |
66 |
7 |
0,14 |
0,84 |
0,035 |
6 |
[ 68; 72 ) |
70 |
7 |
0,14 |
0,98 |
0,035 |
7 |
[ 72; 76 ] |
74 |
1 |
0,02 |
1,00 |
0,005 |
Используя полученные результаты для xi* и ni/n строим полигон относительных частот (рисунок 1); используя столбец 2-й и 7-й строим гистограмму относительных частот (рисунок 2); используя столбец 3-й и 6-й, строим график эмпирической функции распределения (рисунок 3).
Для величины Y аналогичные результаты укажем в окончательном виде. ymin = 153, ymax = 183,
Таблица 4
Номер интервала
i |
Интервалы
[bi-1, bi) |
Середины интервалов
yi* |
Частоты
ni |
Относительные частоты
ni/n |
Накопленные относительные частоты
|
|
1 |
[150,5; 155,5) |
153 |
3 |
0,06 |
0,06 |
0,012 |
2 |
[155,5; 160,5) |
158 |
9 |
0,18 |
0,24 |
0,036 |
3 |
[160,5; 165,5) |
163 |
17 |
0,34 |
0,58 |
0,068 |
4 |
[165,5; 170,5) |
168 |
14 |
0,28 |
0,86 |
0,056 |
5 |
[170,5; 175,5) |
173 |
4 |
0,08 |
0,94 |
0,016 |
6 |
[175,5; 180,5) |
178 |
2 |
0,04 |
0,98 |
0,008 |
7 |
[180,5; 185,5] |
183 |
1 |
0,02 |
1,00 |
0,004 |
На рисунках 4 – 6 изображены полигон, гистограмма относительных частот и график эмпирической функции распределения для величины Y:
3. Точечные оценки , ,
,
,
Составим таблицу 5:
Таблица 5
Номер интервала, i |
ui |
ni |
uini |
|
vi |
ni |
vini |
|
1 |
-3 |
3 |
-9 |
27 |
-3 |
3 |
-9 |
27 |
2 |
-2 |
8 |
-16 |
32 |
-2 |
9 |
-18 |
36 |
3 |
-1 |
6 |
-6 |
6 |
-1 |
17 |
-17 |
17 |
4 |
0 |
18 |
0 |
0 |
0 |
14 |
0 |
0 |
5 |
1 |
7 |
7 |
7 |
1 |
4 |
4 |
4 |
6 |
2 |
7 |
14 |
28 |
2 |
2 |
4 |
8 |
7 |
3 |
1 |
3 |
9 |
3 |
1 |
3 |
9 |
|
– |
50 |
-7 |
109 |
– |
50 |
-33 |
101 |
Вначале вычислим:
;
;
;
;
Искомые оценки:
= 4
+ 62 = 61,4; = 5
;
4. Проверим с помощью критерия
Здесь k = 2 неизвестных параметра mx и ?x (математическое ожидание и среднее квадратичное отклонение) заменяются соответствующими оценками = 61,4 и sx= 5,92.
В качестве интервалов возьмем вначале интервалы [ai-1, ai], i = 1, … ,7 , приняв
а0 = –
, а7 = +
Результаты расчетов выборочной величины
Таблица 6
i |
[ai-1, ai), |
ni |
|
Ф(zi) |
pi = Ф(zi) – Ф(zi-1) |
npi |
|
1 |
(– ; 52 ) |
3 |
-1,59 |
-0,444 |
-0,444-(-0,5)=0,056 |
2,8 |
0,42 |
2 |
[ 52; 56 ) |
8 |
-0,91 |
-0,319 |
0,125 |
6,25 |
|
3 |
[ 56; 60 ) |
6 |
-0,24 |
-0,095 |
0,224 |
11,2 |
2,41 |
4 |
[ 60; 64 ) |
18 |
0,44 |
0,170 |
0,265 |
13,25 |
1,70 |
5 |
[ 64; 68 ) |
7 |
1,11 |
0,367 |
0,197 |
9,85 |
0,82 |
6 |
[ 68; 72 ) |
7 |
1,79 |
0,463 |
0,096 |
4,8 |
0,27 |
7 |
[ 72; + ) |
1 |
+
|
0,500 |
0,037 |
1,85 |
|
|
– |
50 |
– |
– |
1 |
50 |
= 5,62 |
Пришлось произвести объединение первых и последних двух интервалов из-за малости теоретических частот.
В итоге число интервалов m = 5, поэтому число степеней свободы для
распределения равно m – k – 1 = 5 – 2 – 1 = 2. По таблице П2 приложения находим
Вывод: так как
= 5,62<
Аналогично проверяем гипотезу H0: распределение генеральной совокупности Y имеет нормальный закон N(my, ?y).
Параметры my и ?y заменяем соответственно оценками = 164,7 и sy = 6,34. Используя интервалы [bi-1, bi) и частоты mi i = 1, … ,7 из таблицы 4, проведем вычисление
Таблица 7:
i |
[bi-1, bi), |
mi |
|
Ф(zi) |
pi = Ф(zi) – Ф(zi-1) |
npi |
|
1 |
(– ; 155,5) |
3 |
-1,45 |
-0,427 |
-0,427 - (-0,5) = 0,073 |
3,65 |
0,04 |
2 |
[155,5; 160,5) |
9 |
-0,66 |
-0,245 |
0,182 |
9,1 |
|
3 |
[160,5; 165,5) |
17 |
0,13 |
0,051 |
0,296 |
14,8 |
0,33 |
4 |
[165,5; 170,5) |
14 |
0,91 |
0,319 |
0,268 |
13,4 |
0,03 |
5 |
[170,5; 175,5) |
4 |
1,70 |
0,455 |
0,136 |
6,8 |
0,46 |
6 |
[175,5; 180,5) |
2 |
2,49 |
0,494 |
0,039 |
1,95 |
|
7 |
[180,5; + ) |
1 |
+
|
0,500 |
0,006 |
0,30 |
|
|
– |
50 |
– |
– |
1 |
50 |
= 0,86 |
Здесь объединены два первых и три последних интервала, чтобы выполнялось условие npi > 5. В итоге получили m = 4 интервалов, поэтому число степеней свободы для
распределения равно m – k – 1 = 4 – 2 – 1 = 1. По таблице П2 приложения определяем
Вывод: так как
= 0,86 <
5. Доверительный интервал для математического ожидания M[X] имеет вид:
= t 0,975 (49) = 2,01, получим с надежностью ? = 0,95
59,71 < M[X] < 63,09.
Аналогично получим доверительный интервал для математического ожидания M[Y] (учитывая, что = 164,7 , sy = 6,34):
162,90 < M[Y] < 166,50.
Доверительный интервал для дисперсии D[X] имеет вид:
Так как
= 35,2;
;
24,16 < D[X] < 53,23.
Аналогично определяется доверительный интервал для дисперсии D[Y] с учетом, что
27,62 < D[Y] < 60,87.
6. Построим корреляционную таблицу 8 – таблицу с двумя входами. По вертикали расположим интервалы [ai-1, ai) для величины Х, а по горизонтали интервалы [bi-1, bi), для Y ( i = 1, …, 7, j = 1, …, 7 ). Каждую пару выборочных значений ( xk, yk ), k = 1, …, 50 разнесем по полученным клеткам, в результате получим частоты nij – количество пар
( xk, yk ), таких, что xk
[ai-1, ai) и yk
Вычислим выборочный коэффициент rв, используя условные варианты, по формуле:
,
где
=
=
+(-1) ?(-2) ?1+(-1) ?(-1) ?2+1?(-2) ?1+1?(-1) ?2+1?1?2+2?(-1) ?2+2?1?1+2?2?1+3?3?1] =
= – 0,14 ;
= – 0,66 ; su = 1,48 ; sv = 1,27.
Итак,
Y
X |
[150,5;155,5)
=153 <-3> |
[155,5; 160,5)
=158 <-2> |
[160,5; 165,5)
=163 <-1> |
[165,5; 170,5)
=168 <0> |
[170,5; 175,5)
=173 <1> |
[175,5; 180,5)
=178 <2> |
[180,5; 185,5]
=183 <3> |
ni. |
( ) |
[48; 52)
= 50 <-3> |
.. 2 |
. 1 |
|
|
|
|
|
3 |
154,7 |
[52; 56)
= 54 <-2> |
|
…. 4 |
. 1 |
… 3 |
|
|
|
8 |
162,4 |
[56; 60)
= 58 <-1> |
. 1 |
. 1 |
.. 2 |
.. 2 |
|
|
|
6 |
162,2 |
[60; 64)
= 62 <0> |
|
.. 2 |
…… 10 …. |
…. 4 |
. 1 |
. 1 |
|
18 |
164,4 |
[64; 68)
= 66 <1> |
|
. 1 |
.. 2 |
.. 2 |
.. 2 |
|
|
7 |
166,6 |
[68; 72)
= 70 <2> |
|
|
.. 2 |
… 3 |
. 1 |
. 1 |
|
7 |
168,7 |
[72; 76]
= 74 <3> |
|
|
|
|
|
|
. 1 |
1 |
183,0 |
n.j |
3 |
9 |
17 |
14 |
4 |
2 |
1 |
?=50 |
|
( ) |
52,7 |
57,1 |
62,5 |
62 |
66 |
66 |
74 |
|
|
Таблица 8
Проверим гипотезу H0: между X и Y отсутствует корреляционная связь, то есть коэффициент корреляции генеральной совокупности r = 0, при конкурирующей гипотезе H1: r > 0. Гипотезу H1 взяли с учетом того, что выборочный коэффициент rв = 0,57 > 0.
В качестве статистики возьмем величину:
При рассматриваемой гипотезе H1 критическая область будет односторонней
Vкр = (t1-?(n-2) ; +
) = ( t0,95 (48) ; +
) = (1,68 ; +
Вычислим выборочное значение статистики:
Так как tв(48) = 4,81
7. Выборочное уравнение прямой линии регрессии Y на X имеет вид:
.
Подставляя в это уравнение значения
,
или y = 0,61x + 127,28.
.
Отсюда
Для построения эмпирических линий регрессии Y на X и X на Y найдем условные средние (
) и (
(
) =
(
) =
(
) =
(
) =
(
) =
(
) =
(
) =
(
) =
(
) =
(
) =
(
) =
(
) =
(
) =
(
) =
Итак, получены точки Mi(
,(
M1 (50; 154,7),
М2 (54; 162,4),
М3 (58; 162,2),
М4 (62; 164,8),
M5 (66; 166,6),
M6 (70; 168,7),
M7 (74; 183)
и точки Nj ((
),
N1 (52,7; 153),
N2 (57,1; 158),
N3 (62,5; 163),
N4 (62; 168);
N5 (66; 173),
N6 (66; 178);
N7 (74; 183).
Ломаная с вершинами в точках Mi(
,(
)) есть эмпирическая линия регрессии Y и X (на рисунке 7 – линия 1), а ломанная с вершинами в точках Nj ((
),
На рисунке 7 также изображены прямые линии регрессии Y на X (сплошной линией) и X на Y (пунктирной линией). На этом же рисунке отмечены выборочные точки (xi, yi),
i = 1, … 50 (диаграмма рассеивания).