Вход

Типовой расчет по математической статистике

Контрольная работа по математике
Дата добавления: 30 сентября 2007
Язык контрольной: Русский
Word, rtf, 416 кб (архив zip, 30 кб)
Контрольную можно скачать бесплатно
Скачать


Министерство образования и науки Российской Федерации



Алтайский государственный технический университет им. И.И. Ползунова



Кафедра высшей математики и математического моделирования





Типовой расчет по математической статистике

(вариант № 12)



Выполнил: ст. гр. ЭУП-41

Козлов А.В.

Проверил: Зайцев В.П.













Барнаул 2006



1. Сформируем выборку объема n = 50 из генеральной совокупности (X, Y), представленной в таблице П4 приложения. Для этого воспользуемся таблицей из 50-ти случайных чисел, полученных с помощью датчика случайных чисел. Эти числа указывают номера элементов, которые будут взяты из генеральной совокупности:


Таблица 1 (таблица случайных чисел)


40

85

57

45

94

84

38

38

17

42

58

67

79

26

78

90

60

28

47

47

71

54

23

54

7

74

46

19

39

59

9

54

16

24

99

83

75

98

52

46

20

46

2

5

85

61

59

19

39

51


Таблица 2 (выборочная совокупность)


xi

yi

xi

yi

xi

yi

xi

yi

xi

yi

65,2

162

65,1

158

56,2

162

61,0

161

51,2

153

65,5

171

61,8

157

54,8

159

54,8

159

55,9

168

51,6

156

56,9

166

70,9

179

60,9

165

55,3

165

60,8

177

71,4

171

54,8

159

57,4

160

57,2

154

71,9

168

63,7

169

60,5

159

63,3

167

65,5

171

75,1

183

62,4

165

60,8

169

60,0

171

61,9

162

68,0

165

63,5

167

55,9

168

58,7

166

67,7

169

68,0

165

59,7

164

62,5

161

50,1

153

62,5

161

62,0

165

69,0

168

60,7

162

52,9

159

60,7

162

67,8

163

69,0

168

67,7

169

55,9

168

60,4

162


2. Составим группированный ряд для величины Х. Для этого определим наибольшее xmax = 75,1 и наименьшее xmin = 50,1 значения величины X, встречающиеся в выборке. Вычислим размах Rx = xmax xmin = 75,1 – 50,1 = 25. Весь промежуток разобьем на r = 7 интервалов. Тогда шаг разбиения hx = Rx/r = 25/7 ? 3,571. Для того, чтобы шаг разбиения был удобный, возьмем его равным hx = 4. Тогда расширение промежутка составит:

(4 – 3,571) ? 7 ? 3,003.


Результаты группировки выборочных значений для Х сведем в таблицу 3:


Таблица 3


Номер интервала


i

Интервалы



[ai-1, ai)

Середины интервалов


xi*

Частоты



ni

Относительные

частоты


ni/n

Накопленные относительные частоты






1

[ 48; 52 )

50

3

0,06

0,06

0,015

2

[ 52; 56 )

54

8

0,16

0,22

0,040

3

[ 56; 60 )

58

6

0,12

0,34

0,030

4

[ 60; 64 )

62

18

0,36

0,70

0,090

5

[ 64; 68 )

66

7

0,14

0,84

0,035

6

[ 68; 72 )

70

7

0,14

0,98

0,035

7

[ 72; 76 ]

74

1

0,02

1,00

0,005


Используя полученные результаты для xi* и ni/n строим полигон относительных частот (рисунок 1); используя столбец 2-й и 7-й строим гистограмму относительных частот (рисунок 2); используя столбец 3-й и 6-й, строим график эмпирической функции распределения (рисунок 3).




Для величины Y аналогичные результаты укажем в окончательном виде. ymin = 153, ymax = 183,


Ry = 30, hy = Ry/7 ? 4,286. Возьмем hy = 5. Расширение промежутка разбиения составит (5 – 4,286) ?7 ? 5.


Таблица 4


Номер интервала


i

Интервалы



[bi-1, bi)

Середины интервалов


yi*

Частоты



ni

Относительные

частоты


ni/n

Накопленные относительные частоты






1

[150,5; 155,5)

153

3

0,06

0,06

0,012

2

[155,5; 160,5)

158

9

0,18

0,24

0,036

3

[160,5; 165,5)

163

17

0,34

0,58

0,068

4

[165,5; 170,5)

168

14

0,28

0,86

0,056

5

[170,5; 175,5)

173

4

0,08

0,94

0,016

6

[175,5; 180,5)

178

2

0,04

0,98

0,008

7

[180,5; 185,5]

183

1

0,02

1,00

0,004


На рисунках 4 – 6 изображены полигон, гистограмма относительных частот и график эмпирической функции распределения для величины Y:


3. Точечные оценки , ,


,


вычислим по группированным данным. Для удобства вычислений перейдем к условным вариантам:



,





Составим таблицу 5:


Таблица 5


Номер интервала,

i


ui


ni


uini





vi


ni


vini




1

-3

3

-9

27

-3

3

-9

27

2

-2

8

-16

32

-2

9

-18

36

3

-1

6

-6

6

-1

17

-17

17

4

0

18

0

0

0

14

0

0

5

1

7

7

7

1

4

4

4

6

2

7

14

28

2

2

4

8

7

3

1

3

9

3

1

3

9

50

-7

109

50

-33

101


Вначале вычислим:



;







;


;





;





Искомые оценки:

= 4


+ 62 = 61,4; = 5


+168 = 164,7



;




sx = 5,93 sy = 6,34

4. Проверим с помощью критерия


гипотезу H0: распределение генеральной совокупности X имеет нормальный закон N(mx, ?x).

Здесь k = 2 неизвестных параметра mx и ?x (математическое ожидание и среднее квадратичное отклонение) заменяются соответствующими оценками = 61,4 и sx= 5,92.

В качестве интервалов возьмем вначале интервалы [ai-1, ai], i = 1, … ,7 , приняв

а0 = –

, а7 = +


.

Результаты расчетов выборочной величины


приведем в таблице 6:








Таблица 6


i

[ai-1, ai),

ni




Ф(zi)


pi = Ф(zi) – Ф(zi-1)


npi



1

(–

; 52 )

3

-1,59

-0,444

-0,444-(-0,5)=0,056

2,8

0,42

2

[ 52; 56 )

8

-0,91

-0,319

0,125

6,25

3

[ 56; 60 )

6

-0,24

-0,095

0,224

11,2

2,41

4

[ 60; 64 )

18

0,44

0,170

0,265

13,25

1,70

5

[ 64; 68 )

7

1,11

0,367

0,197

9,85

0,82

6

[ 68; 72 )

7

1,79

0,463

0,096

4,8

0,27

7

[ 72; +

)

1

+


0,500

0,037

1,85

50

1

50


= 5,62


Пришлось произвести объединение первых и последних двух интервалов из-за малости теоретических частот.

В итоге число интервалов m = 5, поэтому число степеней свободы для


распределения равно mk – 1 = 5 – 2 – 1 = 2. По таблице П2 приложения находим


(2) = 5,99.

Вывод: так как


= 5,62<


(2) = 5,99, то гипотеза H0 о нормальном распределении величины X не противоречит выборочным данным.


Аналогично проверяем гипотезу H0: распределение генеральной совокупности Y имеет нормальный закон N(my, ?y).

Параметры my и ?y заменяем соответственно оценками = 164,7 и sy = 6,34. Используя интервалы [bi-1, bi) и частоты mi i = 1, … ,7 из таблицы 4, проведем вычисление


, оформив таблицу 7:


Таблица 7:


i

[bi-1, bi),

mi




Ф(zi)


pi = Ф(zi) – Ф(zi-1)


npi



1

(–

; 155,5)

3

-1,45

-0,427

-0,427 - (-0,5) = 0,073

3,65

0,04

2

[155,5; 160,5)

9

-0,66

-0,245

0,182

9,1

3

[160,5; 165,5)

17

0,13

0,051

0,296

14,8

0,33

4

[165,5; 170,5)

14

0,91

0,319

0,268

13,4

0,03

5

[170,5; 175,5)

4

1,70

0,455

0,136

6,8

0,46

6

[175,5; 180,5)

2

2,49

0,494

0,039

1,95

7

[180,5; +

)

1

+


0,500

0,006

0,30

50

1

50


= 0,86


Здесь объединены два первых и три последних интервала, чтобы выполнялось условие npi > 5. В итоге получили m = 4 интервалов, поэтому число степеней свободы для


распределения равно mk – 1 = 4 – 2 – 1 = 1. По таблице П2 приложения определяем


(1) = 3,84.

Вывод: так как


= 0,86 <


(1) = 3,84, то гипотеза H0 о нормальном распределении величины Y не противоречит выборочным данным.



5. Доверительный интервал для математического ожидания M[X] имеет вид:






Учитывая, что = 61,4, sx = 5,93, n = 50, ? = 1 – ? = 0,05,


= t 0,975 (49) = 2,01, получим с надежностью ? = 0,95



59,71 < M[X] < 63,09.


Аналогично получим доверительный интервал для математического ожидания M[Y] (учитывая, что = 164,7 , sy = 6,34):


162,90 < M[Y] < 166,50.


Доверительный интервал для дисперсии D[X] имеет вид:





Так как


= 35,2;


;


, то с надежностью ? = 0,95 получим:


24,16 < D[X] < 53,23.


Аналогично определяется доверительный интервал для дисперсии D[Y] с учетом, что


= 40,25:

27,62 < D[Y] < 60,87.


6. Построим корреляционную таблицу 8 – таблицу с двумя входами. По вертикали расположим интервалы [ai-1, ai) для величины Х, а по горизонтали интервалы [bi-1, bi), для Y ( i = 1, …, 7, j = 1, …, 7 ). Каждую пару выборочных значений ( xk, yk ), k = 1, …, 50 разнесем по полученным клеткам, в результате получим частоты nij – количество пар

( xk, yk ), таких, что xk

[ai-1, ai) и yk


[bi-1, bi). В угловых скобках <…> указаны значения условных вариант ui и vj. В последнем столбце и последней строке вычислены условные средние.

Вычислим выборочный коэффициент rв, используя условные варианты, по формуле:


,


где


=


=


[(-3) ?(-3) ?2+(-3) ?(-2) ?1+(-2) ?(-2) ?4+(-2) ?(-1) ?1+(-1) ?(-3) ?1+

+(-1) ?(-2) ?1+(-1) ?(-1) ?2+1?(-2) ?1+1?(-1) ?2+1?1?2+2?(-1) ?2+2?1?1+2?2?1+3?3?1] =


=1,16;



= – 0,14 ;


= – 0,66 ; su = 1,48 ; sv = 1,27.



Итак,







Y


X

[150,5;155,5)


=153

<-3>

[155,5; 160,5)

=158

<-2>

[160,5; 165,5)


=163

<-1>

[165,5; 170,5)


=168

<0>

[170,5; 175,5)


=173

<1>

[175,5; 180,5)


=178

<2>

[180,5; 185,5]

=183

<3>

ni.

(

)

[48; 52)


= 50

<-3>

.. 2

. 1






3

154,7

[52; 56)


= 54

<-2>


. 4

. 1

3




8

162,4

[56; 60)


= 58

<-1>

. 1

. 1

.. 2

.. 2




6

162,2

[60; 64)


= 62

<0>


.. 2

…… 10

.

. 4

. 1

. 1


18

164,4

[64; 68)


= 66

<1>


. 1

.. 2

.. 2

.. 2



7

166,6

[68; 72)


= 70

<2>



.. 2

3

. 1

. 1


7

168,7

[72; 76]


= 74

<3>







. 1

1

183,0

n.j

3

9

17

14

4

2

1

?=50


(

)

52,7

57,1

62,5

62

66

66

74



Таблица 8


Проверим гипотезу H0: между X и Y отсутствует корреляционная связь, то есть коэффициент корреляции генеральной совокупности r = 0, при конкурирующей гипотезе H1: r > 0. Гипотезу H1 взяли с учетом того, что выборочный коэффициент rв = 0,57 > 0.

В качестве статистики возьмем величину:




.

При рассматриваемой гипотезе H1 критическая область будет односторонней


Vкр = (t1-?(n-2) ; +

) = ( t0,95 (48) ; +

) = (1,68 ; +


).

Вычислим выборочное значение статистики:




4,81.

Так как tв(48) = 4,81


Vкр, то H0 отвергаем, то есть следует считать, что наблюдаемые величины X и Y (вес и рост человека) коррелированные, причем большему значению X в среднем соответствует большее значение величины Y.


7. Выборочное уравнение прямой линии регрессии Y на X имеет вид:




.


Подставляя в это уравнение значения


,


, sx, sy, rв, получаем:




или y = 0,61x + 127,28.


Выборочное уравнение прямой линии регрессии X на Y:


.


Отсюда




или x = 0,53y – 26,41.

Для построения эмпирических линий регрессии Y на X и X на Y найдем условные средние (


) и (


), используя корреляционную таблицу 8:

(


) =


(153?2 + 158?1) = 154,7

(


) =


(158?4 + 163?1 + 168?3) = 162,4

(


) =


(153?1 + 158?1 + 163?2 + 168?2) = 162,2

(


) =


(158?2 + 163?10 + 168?4 + 173?1 + 178?1) = 164,8

(


) =


(158?1 + 163?2 + 168?2 + 173?2) = 166,6

(


) =


(163?2 + 168?3 + 173?1 + 178?1) = 168,7

(


) =


?183?1 = 183,0

(


) =


(50?2 + 58?1) = 52,7

(


) =


(50?1 + 54?4 + 58?1 + 62?2 + 66?1) = 57,1

(


) =


(54?1 + 58?2 + 62?10 + 66?2 + 70?2) = 62,5

(


) =


(54?3 + 58?2 + 62?4 + 66?2 + 70?3) = 62

(


) =


(62?1 + 66?2 + 70?1) = 66

(


) =


(62?1 + 70?1) = 66

(


) =


?74?1 = 74


Итак, получены точки Mi(


,(


)):

M1 (50; 154,7),

М2 (54; 162,4),

М3 (58; 162,2),

М4 (62; 164,8),

M5 (66; 166,6),

M6 (70; 168,7),

M7 (74; 183)


и точки Nj ((


),


):

N1 (52,7; 153),

N2 (57,1; 158),

N3 (62,5; 163),

N4 (62; 168);

N5 (66; 173),

N6 (66; 178);

N7 (74; 183).


Ломаная с вершинами в точках Mi(


,(


)) есть эмпирическая линия регрессии Y и X (на рисунке 7 – линия 1), а ломанная с вершинами в точках Nj ((


),


) – эмпирическая линия регрессии X на Y (на рисунке 7 – линия 2).

На рисунке 7 также изображены прямые линии регрессии Y на X (сплошной линией) и X на Y (пунктирной линией). На этом же рисунке отмечены выборочные точки (xi, yi),

i = 1, … 50 (диаграмма рассеивания).

© Рефератбанк, 2002 - 2017