Вход

Ранговая корреляция

Реферат по математике
Дата добавления: 10 января 2010
Язык реферата: Русский
Word, rtf, 1.5 Мб (архив zip, 83 кб)
Реферат можно скачать бесплатно
Скачать

ОГЛАВЛЕНИЕ

Введение…………………………………………………………………….3

Правила выполнения ранжирования……………………………………...6

Примеры…………………………………………………………………….7

Методика расчёта коэффициента корреляции рангов Спирмэна……….9

Примеры …………………………………………………………………..11

Приложение……………………………………………………………….16

Список литературы……………………………………………………….17


















ВВЕДЕНИЕ

Исследуя природу, общество, экономику, психологию необходимо считаться с взаимосвязью наблюдаемых процессов и явлений. При этом полнота описания, так или иначе, определяется количественными характеристиками причинно-следственных связей между ними. Оценка наиболее существенных из них, а так же воздействие одних факторов на другие является одной из основных задач статистики.

Формы проявления взаимосвязей весьма разнообразны. В качестве двух самых общих их видов выделяют функциональную (полную) и корреляционную (неполную) связи. В первом случае величине факторного признака строго соответствует одно или несколько значений функции. Функциональная связь достаточно часто проявляется в физике, химии. В экономике примером такой зависимости может служить прямо пропорциональная зависимость между производительностью труда и увеличением производства продукции.

Корреляционная связь (которую так же называют неполной, или статистической) проявляется в среднем, для массовых наблюдений, когда заданным значениям зависимой переменной соответствует некоторый ряд вероятных значений независимой переменной. Объяснение тому – сложность взаимосвязей между анализируемыми факторами, на взаимодействие которых влияют неучтённые случайные величины. Поэтому связь между признаками проявляется лишь в среднем, в массе случаев. При корреляционной связи каждому значению аргумента соответствуют случайно распределённые в некотором интервале значения функции.

Например, некоторое увеличение аргумента повлечёт за собой лишь среднее увеличение (или уменьшение) функции, тогда как конкретные значения у отдельных единиц наблюдения будут отличаться от среднего значения. Такие зависимости встречаются повсеместно. Например, в сельском хозяйстве это может быть связь между урожайностью и количеством внесённых удобрений. Очевидно, что удобрения участвуют в формировании урожая. Но для каждого конкретного поля одно и тоже количество внесённых удобрений, вызовет разный прирост урожайности. Так как во взаимодействии находится ещё целый ряд факторов (погода, состояние почвы и другие факторы), которые и формируют конечный результат. Однако в среднем такая связь наблюдается – увеличение массы внесённых удобрений, ведёт к росту урожайности.

В наиболее общем виде задача статистики в психологических и иных исследованиях, в области изучения взаимосвязей состоит в количественной оценке их наличия и направления, а так же характеристике силы и формы влияния одних факторов на другие факторы.

По направлению связи бывают прямыми, когда зависимая переменная растёт с увеличением факторного признака, и обратными, когда рост факторного признака сопровождается уменьшением функции.

Относительно своей аналитической формы связи бывают линейными и нелинейными. В первом случае между признаками в среднем проявляются линейные соотношения. Нелинейная взаимосвязь выражается нелинейной функцией, а переменные связаны между собой в среднем не линейно.

Существует ещё одна достаточно важная характеристика связей с точки зрения взаимодействующих факторов. Если характеризуется связь двух признаков, то её принято называть парной регрессией. Если изучаются более чем две переменные – множественной регрессией.

Указанные выше классификационные признаки наиболее часто встречаются в статистическом анализе различных исследований. Но кроме перечисленных связей различают также непосредственные, косвенные и ложные связи. Собственно, суть каждого из них очевидна из названия связей. В первом случае факторы взаимодействуют между собой непосредственно. Для косвенной связи характерно участие, какой – то третьей переменной, которая опосредует связь между изучаемыми признаками. Ложная связь – это связь, установленная формально и, как правило, подтверждённая только количественными оценками. Эта связь не имеет под собой качественной основы или же бессмысленна.

По силе различают слабые и сильные связи. Эта формальная характеристика выражается конкретными величинами и интерпретируется в соответствии с общепринятыми критериями силы связи для конкретных показателей.

Для решения задач корреляционно-регрессионного анализа применяются две группы методов, одна группа включает в себя методы корреляционного анализа, а другая группа включает в себя методы регрессионного анализа. В то же время ряд исследователей объединяет эти методы в корреляционно-регрессионный анализ, что имеет под собой некоторые основания: наличие целого ряда общих вычислительных процедур, взаимодополнение при интерпретации результатов исследований.

В данном реферате я остановлюсь на методе оценки тесноты связи, как между количественными, так и между качественными признаками изучаемых явлений.















ПРАВИЛА ВЫПОЛНЕНИЯ РАНЖИРОВАНИЯ ДАННЫХ

К наиболее часто встречаемым методам субъективного измерения относят ранжирование, парное сравнение, непосредственную оценку и последовательное сравнение.

Ранжирование – наиболее простой метод измерения в порядковой шкале. Однако, если объектов сравнения больше 15, то построение ранжировки представляет для человека достаточно сложную задачу.

Парное сравнение – это такое измерение в порядковой шкале; в результате получается множество матриц, которые требуют дальнейшей обработки для полного упорядочивания.

Непосредственная оценка – это приписывание объектам числовых значений в шкале интервалов или отношений. Измерение является достаточно точным при наличии полной информации у субъекта управления или экспертов. Однако это встречается редко и в таком случае пользуются балльной оценкой, когда измерение производится с точностью до определенного отрезка числовой оси.

Последовательное сравнение представляет собой комплексную процедуру измерения, включающую ранжирование и непосредственную оценку. Это самый трудоемкий тип оценок.

Рассмотрим правила ранжирования данных в простых случаях.

Ранжирование данных может производиться по возрастанию или убыванию выделенного признака. Для этого в исходных данных производится упорядочение данных по выделенному признаку в порядке возрастания или убывания. В случае, когда рассматриваются данные качественного признака, то в этом случае предварительно, качественному признаку приписывается некий балл (ранг) и, после этой процедуры производят ранжирование исходных данных по качественному признаку. Например, такая процедура проводится при расчёте коэффициента корреляции рангов Спирмэна.

Рассмотрим некоторые примеры.

ПРИМЕРЫ

Пример 1. Для анализа денежных доходов и расходов на продукты питания домохозяйств одного из района города получены данные, тыс. руб.:

Таблица 1. Денежные доходы и расходы на продукты питания на одного члена домохозяйства.

Номер

Денежный доход, тыс. руб.

Расходы на продукты питания, тыс. руб.

Номер

Денежный доход,

тыс. руб.

Расходы на продукты питания, тыс. руб.

1

28,8

14,9

16

44,3

20,5

2

55,8

22,2

17

58,1

23,2

3

17,1

10,2

18

44,7

19,9

4

20,4

12,4

19

34,4

17,7

5

31,2

16,1

20

39,8

19,3

6

32,2

16,6

21

24,3

13,4

7

37,3

18,4

22

47,5

20,0

8

33,3

17,4

23

40,8

20,3

9

77,1

25,2

24

38,8

18,6

10

66,0

24,3

25

28,0

14,8

11

60,9

22,2

26

36,7

18,0

12

59,1

23,0

27

49,4

21,0

13

33,0

17,1

28

40,4

17,8

14

48,2

20,5

29

37,8

18,4

15

38,0

18,6

30

20,5

11,6


Признак – денежный доход на одного члена домохозяйства.

Ранжируем исходные данные по денежному доходу (по возрастанию).

Таблица 2.

Номер

Денежный доход, тыс. руб.

Расходы на продукты питания, тыс. руб.

Номер

Денежный доход,

тыс. руб.

Расходы на продукты питания, тыс. руб.

3

17,1

10,2

24

38,8

18,6

4

20,4

12,4

20

39,8

19,3

30

20,5

11,6

28

40,4

17,8

21

24,3

13,4

23

40,8

20,3

25

28,0

14,8

16

44,3

20,5

1

28,8

14,9

18

44,7

19,9

5

31,2

16,1

22

47,5

20,0

6

32,2

16,6

14

48,2

20,5

13

33,0

17,1

27

49,4

21,0

8

33,3

17,4

2

55,8

22,2

19

34,4

17,7

17

58,1

23,2

26

36,7

18,0

12

59,1

23,0

7

37,3

18,4

11

60,9

22,2

29

37,8

18,4

10

66,0

24,3

15

38,0

18,6

9

77,1

25,2


Пример 2. Рассмотрим зависимость между успеваемостью студентов ВУЗа по естественным и гуманитарным наукам. Исходные данные представлены в таблице 3.

Таблица 3. Исходные данные об успеваемости.

Студенты

Ранги успеваемости по наукам

естественные,

гуманитарным,

Иванов А.

5

7

Петров В.

4

4

Семёнова И.

8

1

Комков А.

2

10

Шулейкин Е.

10

2

Краснов П.

1

3

Белкин С.

9

6

Кандыба Н.

3

8

Марченко А.

7

9

Якупов Ф.

6

5


В таблице 3 дана оценка успеваемости каждого студента в группе. То есть, каждому студенту приписан ранг от 1 до 10. Ранжируем исходные данные по признаку успеваемость студента по естественным дисциплинам

Таблица 4. Ранжирование исходных данных по признаку .

Студенты

Ранги успеваемости по наукам

естественные,

гуманитарные,

Краснов П.

1

9

Комков А.

2

10

Кандыба Н.

3

8

Петров В.

4

5

Иванов А.

5

4

Якупов Ф.

6

7

Марченко А.

7

6

Семёнова И.

8

1

Белкин С.

9

2

Шулейкин Е.

10

3

Итого:

55

55






МЕТОДИКА РАСЧЁТА КОЭФФИЦИЕНТА КОРРЕЛЯЦИИ РАНГОВ СПИРМЭНА

Теснота связи, как между количественными, так и между качественными признаками, при условии, что значения этих признаков могут быть проранжированы по степени убывания или возрастания, оценивается коэффициентом корреляции рангов Спирмэна:

,

где разность между величинами рангов признака-фактора и результативного признака; число наблюдаемых единиц (объём выборочной совокупности).

Коэффициент корреляции рангов Спирмэна изменяется в пределах от -1 до +1.

Ранговый коэффициент обычно исчисляется на основе небольшого объёма исходной информации, поэтому необходимо выполнить проверку его существенности (значимости). В приложении 1 приводится таблица предельных значений коэффициента корреляции рангов Спирмэна при условии верности нулевой гипотезы об отсутствии корреляционной связи при заданном уровне значимости и определённом объёме выборочной совокупности (выборочных данные).

Если полученное значение по модулю превышает критическую величину при данном уровне значимости, то нулевая гипотеза может быть отвергнута, то есть, величина не является результатом случайных совпадений рангов.

То есть, если

,

то нулевая гипотеза отвергается при данном уровне значимости и числе степеней свободы , количество наблюдений. Это условие можно записать следующим образом:

.

Прямая трактовка коэффициента корреляции рангов Спирмэна состоит в том, что если , то связь между изучаемыми признаками отсутствует. Если величина положительная правильная дробь, то есть, , то между изучаемыми признаками имеется прямая связь. Если величина отрицательная правильная дробь, то есть, , то между изучаемыми признаками имеется обратная связь.























ПРИМЕР (случай не повторяющихся рангов)

Для примера рассмотрим зависимость между успеваемостью студентов ВУЗа по естественным и гуманитарным наукам. Исходные данные представлены в таблице 1.

Таблица 5. Исходные данные.

Студенты

Ранги успеваемости по наукам

естественные,

гуманитарным,

Иванов А.

5

7

Петров В.

4

4

Семёнова И.

8

1

Комков А.

2

10

Шулейкин Е.

10

2

Краснов П.

1

3

Белкин С.

9

6

Кандыба Н.

3

8

Марченко А.

7

9

Якупов Ф.

6

5


В таблице 5 дана оценка успеваемости каждого студента в группе. То есть, каждому студенту приписан ранг от 1 до 10. Ранжируем исходные данные по признаку успеваемость студента по естественным дисциплинам

Таблица 6. Расчёты.

Студенты

Ранги успеваемости по наукам



естественные,

гуманитарные,

Краснов П.

1

9

-8

64

Комков А.

2

10

-8

64

Кандыба Н.

3

8

-5

25

Петров В.

4

5

-1

1

Иванов А.

5

4

1

1

Якупов Ф.

6

7

-1

1

Марченко А.

7

6

1

1

Семёнова И.

8

1

7

49

Белкин С.

9

2

7

49

Шулейкин Е.

10

3

7

49

Итого:

55

55


304


Вычисляем коэффициент корреляции рангов Спирмэна по формуле:

В нашем случае имеем . Тогда,

.

Таким образом, между способностями студентов к естественным и гуманитарным наукам имеется обратная, весьма существенная, связь.

Табличные значения коэффициента корреляции рангов Спирмэна при уровне значимости , числе наблюдений и числе степеней свободы , есть:

,

при уровне значимости и числе наблюдений и числе степеней свободы , есть:

,

Так как, расчётное значение коэффициента корреляции рангов Спирмэна равно и, следовательно,

,

то можно заключить, что сделанный нами вывод о существовании обратной и весьма существенной связи между способностями студентов к естественным и гуманитарным наукам, гарантирован с доверительной вероятностью больше 0,98 , но меньшей 0,99 . То есть, получили статистически значимый результат.








ПРИМЕР (случай повторяющихся рангов)

Имеются данные по тесту «Аналогии» обозначенные , а по тесту «Классификации» .

Ко­эффициент корреляции рангов показывает тесноту связи между выполнением задач в тестах «Аналогии» и «Классификации».

Формула ранговой корреляции:

,

где разность между величинами рангов признака-фактора и результативного признака, то есть ; число наблюдаемых единиц (объём выборочной совокупности).

Таблица 7. Расчёты.

Испыту­емые

Ранг

Ранг

1

А

1

1,0

3

1,0

0,0

0,00

2

Б

2

2,0

4

2,0

0,0

0,00

3

В

3

3,5

5

3,0

0,5

0,25

4

Г

3

3,5

6

4,5

1,0

1,00

5

Д

4

6,0

6

4,5

1,5

2,25

6

Е

4

6,0

7

6,5

0,5

0,25

7

Ж

4

6,0

7

6,5

0,5

0,25

8

3

5

8,5

8

9,5

1,0

1,00

9

И

5

8,5

8

9,5

1,0

1,00

10

К

6

10,5

8

9,5

1,0

1,00

11

Л

6

10,5

8

9,5

1,0

1,00

12

М

7

12,0

9

12,5

0,5

0,25

13

Н

8

13,0

9

12,5

0,5

0,25

14

О

9

14,0

10

14,0

0,0

0,00

15

П

10

15,0

11

15,0

0,0

0,00

,






Число степеней свободы равно .

Производится раздельное ранжирование ряда х и ряда у. Ранги назначаются следующим образом. Например, испытуемые В и Г занимают места с 3 по 4 по тесту «Аналогии» . Следовательно, ранг для этих испытуемых будет одинаковым. Этот ранг рассчитывается следующим образом.

.

Испытуемые Д, Е и Ж занимают места с 5 по 7 по тесту «Аналогии» . Следовательно, ранг для этих испытуемых будет одинаковым. Этот ранг рассчитывается следующим образом.

.

Испытуемые З и И занимают места с 8 по 9 по тесту «Аналогии» . Следовательно, ранг для этих испытуемых будет одинаковым. Этот ранг рассчитывается следующим образом.

.

Испытуемые З, И, К и Л занимают места с 8 по 11 по тесту «Классификации» . Следовательно, ранг для этих испытуемых будет одинаковым. Этот ранг рассчитывается следующим образом.

.

И так далее.

Вычис­ляется разность рангов попарно. Знак разности не существенен, так как по формуле нужно возвести в квадрат. Далее действия определяются формулой:

.

По таблице уровней значимости устанавливаем, что данный результат гарантирован с доверительной вероятностью 0,998.

.

Корреляция как метод статистического анализа в психологиче­ских исследованиях применяется очень часто. Всем, кто работает с применением корреляционного анализа, то есть, выясняет посредством этого метода тесноту связи двух рядов, следует напомнить, что ко­эффициент, как бы высок он ни был, нельзя интерпретировать как показатель наличия причинной связи между коррелируемыми ряда­ми. Если коэффициент и может быть как-то использован в обсуж­дении вопроса о возможных причинных связях, то только в том случае, когда содержательная логика исследования и выдвигаемые при этом теоретические соображения позволяют опереться как на один из аргументов и на значение коэффициента корреляции.























ПРИЛОЖЕНИЕ

Значения коэффициента корреляции рангов Спирмэна для двухсторонних пределов уровня значимости .

Таблица.

0,200


0,100


0,050


0,020


0,010


0,002


4

0,8000

0,8000

-

-

-

-

5

0,7000

0,8000

0,9000

0,9000

-

-

6

0,6000

0,7714

0,8286

0,8857

0,9429

-

7

0,5357

0,6786

0,7450

0,8571

0,8929

0,9643

8

0,5000

0,6190

0,7143

0,8095

0,8571

0,9286

9

0,4667

0,5833

0,6833

0,7667

0,8167

0,9000

10

0,4424

0,5515

0,6364

0,7333

0,7818

0,8667

11

0,4182

0,5273

0,6091

0,7000

0,7455

0,8364

12

0,3986

0,4965

0,5804

0,6713

0,7273

0,8182

13

0,3791

0,4780

0,5549

0,6429

0,6978

0,7912

14

0,3626

0,4593

0,5341

0,6220

0,6747

0,7670

15

0,3500

0,4429

0,5179

0,6000

0,6536

0,7464

16

0,3382

0,4265

0,5000

0,5824

0,6324

0,7265

17

0,3260

0,4118

0,4853

0,5637

0,6152

0,7083

18

0,3148

0,3994

0,4716

0,5480

0,5975

0,6904

19

0,3070

0,3895

0,4579

0,5333

0,5825

0,6737

20

0,2977

0,3789

0,4451

0,5203

0,5684

0,6586

21

0,2909

0,3688

0,4351

0,5078

0,5545

0,6455

22

0,2829

0,3597

0,4241

0,4963

0,5426

0,6318

23

0,2767

0,3518

0,4150

0,4852

0,5306

0,6186

24

0,2704

0,3435

0,4061

0,4748

0,5200

0,6070

25

0,2646

0,3362

0,3977

0,4654

0,5100

0,5962

26

0,2588

0,3299

0,3894

0,4564

0,5002

0,5856

27

0,2540

0,3236

0,3822

0,4481

0,4915

0,5757

28

0,2490

0,3175

0,3749

0,4401

0,4828

0,5660

29

0,2443

0,3113

0,3685

0,4320

0,4744

0,5567

30

0,2400

0,3059

0,3620

0,4251

0,4665

0,5479











СПИСОК ЛИТЕРАТУРЫ

1. В. М. Гусаров, Теория статистики, Москва, ЮНИТИ, 2004. 463 стр.

2. М. Р. Ефимова и другие, Практикум по общей теории статистики, издательство: Финансы и статистика – Москва, 1999. 280 стр.

3. Под редакцией Ю.Н. Иванова, Экономическая статистика, издательство: Москва ИНФРА – М, 2002. 480 стр.

4. Под редакцией Г.В. Ионина. Статистика (курс лекций) Новосибирск: издательство Москва ИНФРА – М, 2003. 310 стр.


© Рефератбанк, 2002 - 2017