11
1
По данным таблицы определить зависимость выпуска продукции (у) от трудозатрат (х) по 15 фирмам. Для этого
1)вычислить:
выборочные средние;
выборочную ковариацию между х и у;
выборочную дисперсию для х и у;
выборочный коэффициент корреляции между х и у;
выборочный коэффициент линейной регрессии у на х и х на у;
уравнение линейной регрессии у на х;
коэффициент детерминации.
2) На одном графике построить корреляционные поля и график уравнения линейной регрессии.
Таблица 1
№ фирмы |
Выпуск продукции |
Трудозатраты |
1 |
2350 |
2334 |
2 |
2470 |
2425 |
3 |
2110 |
2230 |
4 |
2560 |
2463 |
5 |
2650 |
2565 |
6 |
2240 |
2278 |
7 |
2430 |
2380 |
8 |
2530 |
2437 |
9 |
2550 |
2446 |
10 |
2450 |
2403 |
11 |
2290 |
2301 |
12 |
2160 |
2253 |
13 |
2400 |
2367 |
14 |
2490 |
2430 |
15 |
2590 |
2470 |
Решение
В Excel составим вспомогательную таблицу 2.
Таблица 2
Приведем формулы для нахождения искомых величин.
а) выборочные средние для X и Y;
выборочная средняя для X равна:
СУММ(B2:B16)/15= 2385,467
выборочная средняя для Y равна :
СУММ(С2:С16)/15= 2718,0
Ковариация выражает степень статистической зависимости между двумя множествами данных и определяется из следующего соотношения:
Для расчета рассчитаем дополнительный столбец х*у, рассчитаем
=D18-B18*C18=13503,6
Рассмотрим дополнительные столбцы х2 и у2, рассчитаем их средние значения.
=5698383467-2385,4672=7932,259.
= 23802,667.
С помощью парного линейного коэффициента корреляции измеряется теснота связи между двумя признаками. Линейный коэффициент корреляции чаще всего рассчитывается по формуле:
Получили очень высокий коэффициент корреляции, что указывает на прямую и весьма сильную связь между х и у, то есть между выпуском продукции и трудозатратами. С ростом трудозатрат (х), увеличивается объем выпуска продукции (у).
д) выборочные коэффициенты линейной регрессии X на Y и Y на X;
из условия что
=2,949
Тогда
-коэффициент линейной регрессии Y на X
е) Уравнение линейной регрессии Y на X;
Полагаем, что связь между факторами Х и У может быть описана линейной функцией
a n + b ?xi = ?yi,
a ?xi + b ?xi2 = ?xiyi.
Для нашей задачи система имеет вид:
Таким образом, искомое уравнение регрессии имеет вид:
y =-1642,9+1,7024x.
При увеличении трудозатрат на 1 рубль, производительность труда увеличивается на 1,7024 руб.
ж) коэффициент детерминации;
Коэффициент детерминации находим по формуле: R2 = rxy2= 0,97
2) Построить: график линейной регрессии Y на X; корреляционные поля (на одном графике с линейной регрессией).
Рисунок 1. График зависимости объема выпуска продукции от трудозатрат
Таким образом, для выполнения данного задания была создана таблица на листе MS Excel:
Таблица 3
№ |
х |
у |
х*у |
х^2 |
у^2 |
1 |
2334 |
2350 |
5484900 |
5447556 |
5522500 |
2 |
2425 |
2470 |
5989750 |
5880625 |
6100900 |
3 |
2230 |
2110 |
4705300 |
4972900 |
4452100 |
4 |
2463 |
2560 |
6305280 |
6066369 |
6553600 |
5 |
2565 |
2650 |
6797250 |
6579225 |
7022500 |
6 |
2278 |
2240 |
5102720 |
5189284 |
5017600 |
7 |
2380 |
2430 |
5783400 |
5664400 |
5904900 |
8 |
2437 |
2530 |
6165610 |
5938969 |
6400900 |
9 |
2446 |
2550 |
6237300 |
5982916 |
6502500 |
10 |
2403 |
2450 |
5887350 |
5774409 |
6002500 |
11 |
2301 |
2290 |
5269290 |
5294601 |
5244100 |
12 |
2253 |
2160 |
4866480 |
5076009 |
4665600 |
13 |
2367 |
2400 |
5680800 |
5602689 |
5760000 |
14 |
2430 |
2490 |
6050700 |
5904900 |
6200100 |
15 |
2470 |
2590 |
6397300 |
6100900 |
6708100 |
Всего |
35782 |
36270 |
86723430 |
85475752 |
88057900 |
Средние |
2385,466667 |
2418 |
5781562 |
5698383,467 |
5870526,667 |
|
|
|
|
|
|
Выб. Ков. |
13503,6 |
|
a |
-1642,940111 |
|
Выб. дис.х |
7932,248889 |
|
b |
1,702367158 |
|
Выб. дис.у |
23802,66667 |
|
|
|
|
Rxy |
0,982739905 |
|
|
|
|
К. л.р.х на у |
2,948953154 |
|
|
|
|
К. л.р.у на х |
0,3274984953 |
|
|
|
|
Коэф. Детерм. |
0,965777721 |
|
|
|
|
Для проверки некоторых данных при помощи средств Excel проведем регрессионный анализ(пункт меню сервис -> анализ данных) и получим:
Таблица 4
ВЫВОД ИТОГОВ |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Регрессионная статистика |
|
|
|
|
|
|
|
Множественный R |
0,982739905 |
|
|
|
|
|
|
R-квадрат |
0,965777721 |
|
|
|
|
|
|
Нормированный R-квадрат |
0,963145238 |
|
|
|
|
|
|
Стандартная ошибка |
30,65781694 |
|
|
|
|
|
|
Наблюдения |
15 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Дисперсионный анализ |
|
|
|
|
|
|
|
|
df |
SS |
MS |
F |
Значимость F |
|
|
Регрессия |
1 |
344821,3 |
344821,3 |
366,8694959 |
6,54898E-11 |
|
|
Остаток |
13 |
12218,72 |
939,9017 |
|
|
|
|
Итого |
14 |
357040 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Коэффициенты |
Стандартная ошибка |
t-статистика |
P-Значение |
Нижние 95% |
Верхние 95% |
Нижние 95,0% |
Y-пересечение |
-1642,940111 |
212,1648 |
-7,7437 |
3,18811E-06 |
-2101,294224 |
-1184,59 |
-2101,29 |
Переменная X 1 |
1,702367158 |
0,088879 |
19,15384 |
6,54898E-11 |
1,510356517 |
1,894378 |
1,510357 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Выводы:
Коэффициент ковариации, как и корреляции, говорит о положительной связи случайных величин X и Y, то есть с увеличением одной величины, увеличивается и другая.
Коэффициент корреляции очень близок к 1, и это означает, что значения трудозатрат (X) и выпуска продукции (Y) тесно взаимосвязаны друг с другом.
Причем, с увеличением трудозатрат на 1 рубль, производительность труда увеличивается на 1,7024 руб.
Коэффициент детерминации, равный 0,97, который является отношением факторной вариации к полной вариации признака, позволяет судить о том, что выбран линейный вид функции вполне удачно.
Задание 2
На основании таблицы определить зависимость выпуска продукции (у) от трудозатрат (х) и капиталовложений (р) т. е. рассчитать:
1) коэффициенты множественной линейной регрессии у на х и р;
2) парные коэффициенты корреляции, оценить их значимость на уровне 0,05 и пояснить их экономический смысл;
3) частные коэффициенты корреляции и с их помощью оценить целесообразность включения факторов в уравнение регрессии;
4) коэффициент множественной корреляции, множественный коэффициент детерминации, скорректированный коэффициент корреляции и охарактеризовать степень совместного влияния факторов на результативный признак.
Таблица 5
№ фирмы |
Выпуск продукции |
Трудозатраты |
Капиталовложения |
1 |
2350 |
2334 |
1570 |
2 |
2470 |
2425 |
1850 |
3 |
2110 |
2230 |
1150 |
4 |
2560 |
2463 |
1940 |
5 |
2650 |
2565 |
2450 |
6 |
2240 |
2278 |
1340 |
7 |
2430 |
2380 |
1700 |
8 |
2530 |
2437 |
1860 |
9 |
2550 |
2446 |
1880 |
10 |
2450 |
2403 |
1790 |
11 |
2290 |
2301 |
1480 |
12 |
2160 |
2253 |
1240 |
13 |
2400 |
2367 |
1660 |
14 |
2490 |
2430 |
1850 |
15 |
2590 |
2470 |
2000 |
Решение
а) коэффициенты множественной линейной регрессии Y на X и р;
уравнение регрессии будет выглядеть так:
у=а0 + а1 х1 + а2х2
где а0, а1, а2 — параметры, подлежащие определению.
Для нахождения числовых значений искомых параметров, как и в случае одной независимой переменной, пользуются методом наименьших квадратов. Он сводится к составлению и решению системы нормальных уравнений, которая имеет вид:
Таблица 6
При помощи средств Excel проведем регрессионный анализ и получим (пункт меню сервис -> анализ данных):
Таблица 7
ВЫВОД ИТОГОВ |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Регрессионная статистика |
|
|
|
|
|
|
|
Множественный R |
0,986271 |
|
|
|
|
|
|
R-квадрат |
0,972731 |
|
|
|
|
|
|
Нормированный R-квадрат |
0,968186 |
|
|
|
|
|
|
Стандартная ошибка |
28,48397 |
|
|
|
|
|
|
Наблюдения |
15 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Дисперсионный анализ |
|
|
|
|
|||
|
df |
SS |
MS |
F |
Значимость F |
|
|
Регрессия |
2 |
347304 |
173652 |
214,032 |
4,11143E-10 |
|
|
Остаток |
12 |
9736,04 |
811,3367 |
|
|
|
|
Итого |
14 |
357040 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Коэффициенты |
Стандартная ошибка |
t-статистика |
P-Значение |
Нижние 95% |
Верхние 95% |
|
Y-пересечение |
-3872,74 |
1289,847 |
-3,00248 |
0,011016 |
-6683,077615 |
-1062,41 |
|
Переменная X 1 |
2,874401 |
0,675078 |
4,257882 |
0,001112 |
1,403533001 |
4,345269 |
|
Переменная X 2 |
-0,32961 |
0,188424 |
-1,74928 |
0,105748 |
-0,740147667 |
0,080934 |
|
Тогда коэффициенты уравнения линейной регрессии следующие:
а0,= -3872,74; а1,= 2,874401; а2 =-0,32961
и уравнение линейной регрессии будет следующим:
у= -3872,74+2,874401х -0,32961р
б) Парный коэффициент корреляции между х и у факторами вычисляется по формуле:
rxр=0,992.
Проверка существенности отличия коэффициента корреляции от нуля проводится по схеме: если
Здесь t1-?/2,n-2 – квантиль распределения Стьюдента, ? - уровень значимости или уровень доверия, n – число наблюдений, (n-2) – число степеней свободы. Значение ? = 0,05, тогда t1-?/2,n-2 = t0,975,13= 5,01. Получаем:
13,30>5,01 следовательно, коэффициент корреляции существенно отличается от нуля и ????? ???????? ????????? ? ?????????????????? ?????????? ?????? ?????.
29,25>5,01 следовательно, коэффициент корреляции существенно отличается от нуля и ????? ???????? ????????? ? ?????????????? ?????????? ?????? ?????.
в) частные коэффициенты корреляции определяются по формуле:
Rxy.z =
Рассчитаем дополнительные столбцы таблицы, получим:
Rху,р=0,776;
Rхр,у=0,909;
Rур,х=-0,451.
Таким образом, трудозатраты включать в уравнение регрессии нецелесообразно.
г)коэффициент множественной корреляции = 0,986;
коэффициент детерминации:
0,973;
0,968.
Выводы:
Влияние трудозатрат на выпуск продукции меньше, нежели чем влияние капиталовложений на выпуск продукции. Коэффициент детерминации говорит о достаточно тесной взаимосвязи объема капиталовложений с трудозатратами и выпуском продукции.
Список литературы
Кравченко Г.В. Эконометрика: Компьютерный практикум: Учебное пособие Барнаул, 2008. - 56 с.
Практикум по эконометрике: Учебное пособие / Под ред. Елисеевой И.И. - М.: Финансы и статистика, 2004. - 192с
Эконометрика: Учебник / Под ред. Елисеевой И.И. - М.: Финансы и статистика, 2004 . - 344с.
Магнус Я., Катышев П. К., Пересецкий А.А. Эконометрика (начальный курс). М., Изд-во Дело, 2007. – 352 с.
Эконометрика. Методические указания по изучению дисциплины и выполнению контрольной работы и аудиторной работы на ПЭВМ М.: Вузовский учебник, 2005. - 122 с.