Вход

Исследование взаимосвязи социально-экономических явлений с помощью регрессионного анализа

Рекомендуемая категория для самостоятельной подготовки:
Курсовая работа*
Код 218809
Дата создания 24 февраля 2017
Страниц 40
Мы сможем обработать ваш заказ (!) 6 мая в 12:00 [мск]
Файлы будут доступны для скачивания только после обработки заказа.
2 880руб.
КУПИТЬ

Описание

Цель исследования – изучение взаимосвязи между долей населения с денежными доходами ниже величины прожиточного минимума и дефицитом денежного дохода (в процентах от общего объема денежных доходов населения) в Российской Федерации. Достижение данной цели требует решение следующих задач:
- измерение силы взаимосвязи между изучаемыми признаками;
- построение соответствующей модели взаимосвязи;
- проведение углубленного корреляционного анализа и проверка качества построенной модели.
В курсовом проекте, объектом исследования послужила динамика уровня бедности в России за период 1992-2014 гг.
Предмет исследования – статистические характеристики уровня бедности (доли населения с денежными доходами ниже величины прожиточного минимума) в России.

...

Содержание

ВВЕДЕНИЕ 3
1. Аналитическая часть. 5
1.1. Основные понятия корреляционного и регрессионного анализа 5
1.2. Функциональные и стохастические связи. Статистические методы моделирования связи 9
1.3. Статистическое моделирование связи методом корреляционного и регрессионного анализа 14
1.4. Условия применения и ограничения корреляционно-регрессионного метода 17
2. Проектная часть 20
2.1. Пример эконометрического исследования уровня бедности в России 20
2.2. Построение корреляционно-регрессионной модели 23
2.3. Построение модели бедности путём множественной регрессии 34
ЗАКЛЮЧЕНИЕ 37
СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ 38
ПРИЛОЖЕНИЯ 40

Введение

Регрессионный анализ предполагает построение экономико-математических моделей, выражающих зависимости между случайными переменными. Проведение подобного анализа влечет за собой расчет показателей корреляции, поэтому, как правило, при изучении взаимосвязи социально-экономических явлений проводится корреляционно-регрессионный анализ.

Фрагмент работы для ознакомления

к. рассматривается пара признаков). Например, корреляционная связь между прибылью и производительностью труда. В случае многофакторной (множественной) связи имеют в виду, что все факторы действуют комплексно, то есть одновременно и во взаимосвязи. Например, корреляционная связь между производительностью труда и уровнем организации труда, автоматизации производства, квалификации рабочих, производственным стажем, простоями и другими факторными признаками. С помощью множественной корреляции можно охватить весь комплекс факторных признаков и объективно отразить существующие множественные связи. Для исследования стохастических связей широко используется метод сопоставления двух параллельных рядов, метод аналитических группировок, корреляционный анализ, регрессионный анализ и некоторые непараметрические методы[12].Метод сопоставления двух параллельных рядов является одним из простейших методов. Для этого факторы, характеризующие результативный признак располагают в возрастающем или убывающем порядке (в зависимости от эволюции процесса и цели исследования), а затем прослеживают изменение величины результативного признака. Сопоставление и анализ расположенных таким образом рядов значений изучаемых величин позволяют установить наличие связи и ее направление. Зависимость между факторами и показателями может прослеживаться во времени (параллельные динамические ряды). Регрессионный Метод аналитических группировок тоже относится к простейшим методам. Чтобы выявить зависимость с помощью этого метода, нужно произвести группировку единиц совокупности по факторному признаку и для каждой группы вычислить среднее или относительное значение результативного признака. Сопоставляя затем изменения результативного признака по мере изменения факторного можно выявить направление, характер и тесноту связи между ними. Задача является основным средством В общем виде задача статистики в области изучения взаимосвязей состоит не только в количественной оценке их наличия, направления и силы связи, но и в определении формы (аналитического выражения) влияния факторных признаков на результативный. За это, являются ли коэффициенты одновременно нулевыми. Коэффициенты детерминации и множественной корреляции. При сравнении качества регрессии, и необъясненной дисперсии. Корень 1.3. Статистическое моделирование связи методом корреляционного и регрессионного анализа Задачи корреляционного анализа сводятся к измерению тесноты известной связи между варьирующими признаками, определению неизвестных причинных связей (причинный характер которых должен быть выяснен с помощью теоретического анализа) и оценки факторов, оказывающих наибольшее влияние на результативный признак[14].Задачами регрессионного анализа являются выбор типа модели (формы связи), установление степени влияния независимых переменных на зависимую и определение расчётных значений зависимой переменной (функции регрессии). Решение всех названных задач приводит к необходимости комплексного использования этих методов. Рассмотрим за Корреляционный и регрессионный анализ. Исследование связей в условиях массового наблюдения и действия случайных факторов осуществляется, как правило, с помощью экономико-статистических моделей. В широком смысле модель – это аналог, условный образ (изображение, описание, схема, чертёж и т.п.) какого-либо объекта, процесса или события, приближенно воссоздающий «оригинал»[14]. Модель представляет собой логическое или математическое описание компонентов и функций, отображающих существенные свойства моделируемого объекта или процесса, даёт возможность установить основные закономерности изменения оригинала. В модели оперируют показателями, исчисленными для качественно однородных массовых явлений (совокупностей). Выражение и модели в виде функциональных уравнений используют для расчёта средних значений моделируемого показателя по набору заданных величин и для выявления степени влияния на него отдельных факторов. Метод включения и По количеству включаемых факторов модели могут быть однофакторными и многофакторными (два и более факторов). В зависимости от познавательной цели статистические модели подразделяются на структурные, динамические и модели связи. Двухмерная линейная модель корреляционного и регрессионного анализа (однофакторный линейный корреляционный и регрессионный анализ)[18]. Наиболее разработанной в теории статистики является методология так называемой парной корреляции, рассматривающая влияние вариации факторного анализа х на результативный признак у и представляющая собой однофакторный корреляционный и регрессионный анализ. Овладение теорией и практикой построения и анализа двухмерной модели корреляционного и регрессионного анализа представляет собой исходную основу для изучения многофакторных стохастических связей. Важнейшим этапом построения регрессионной модели (уравнения регрессии) является установление в анализе исходной информации математической функции. Сложность заключается в том, что из множества функций необходимо найти такую, которая лучше других выражает реально существующие связи между анализируемыми признаками. Выбор типов функции может опираться на теоретические знания об изучаемом явлении, опят предыдущих аналогичных исследований, или осуществляться эмпирически – перебором и оценкой функций разных типов и т.п.[18]. При изучении связи экономических показателей производства (деятельности) используют различного вида уравнения прямолинейной и криволинейной связи. Внимание к линейным связям объясняется ограниченной вариацией переменных и тем, что в большинстве случаев нелинейные формы связи для выполнения расчётов преобразуют (путём логарифмирования или замены переменных) в линейную форму. Уравнение однофакторной (парной) линейной корреляционной связи имеет вид:ŷ = a0 + a1x ,где ŷ - теоретические значения результативного признака, полученные по уравнению регрессии; a0 , a1 - коэффициенты (параметры) уравнения регрессии. Задача по знаПоскольку a0 является средним значением у в точке х=0, экономическая интерпретация часто затруднена или вообще невозможна. За это иногда заКоэффициент парной линейной регрессии a1 имеет смысл показателя силы связи между вариацией факторного признака х и вариацией результативного признака у. Вышеприведенное уравнение показывает среднее значение изменения результативного признака у при изменении факторного признака х на одну единицу его измерения, то есть вариацию у, приходящуюся на единицу вариации х. Знак a1 указывает направление этого изменения. Параметры уравнения a0 , a1 находят методом наименьших квадратов (метод решения систем уравнений, при котором в качестве решения принимается точка минимума суммы квадратов отклонений), то есть в основу этого метода положено требование минимальности сумм квадратов отклонений эмпирических данных yi от выравненных ŷ:(yi – ŷ)2 = (yi – a0 – a1xi)2 min [18] Для нахождения минимума данной функции приравняем к нулю ее частные производные и получим систему двух линейных уравнений, которая называется системой нормальных уравнений:Решим эту систему в общем виде:Параметры уравнения парной линейной регрессии иногда удобно исчислять по следующим формулам, дающим тот же результат:Определив значения a0 , a1 и подставив их в уравнение связи ŷ = a0 + a1x , находим значения ŷ, зависящие только от заданного значения х. это иногда зависимую переменную 1.4. Условия применения и ограничения корреляционно-регрессионного метода Поскольку корреляционная связь является статистической, первым условием возможности ее изучения является наличие данных по достаточно большой совокупности. По отдельным явлениям можно получить совершенно превратное представление о связи признаков, ибо в каждом отдельном явлении значения признаков, кроме закономерной составляющей, имеют случайное отклонение. Например, сравнивая два хозяйства, одно из которых имеет лучшее качество почв, по уровню урожайности, можно обнаружить, что урожайность выше в хозяйстве с худшими почвами. Ведь урожайность зависит от сотен факторов и при том же самом качестве почв может быть и выше, и ниже. Но если сравнивать большое число хозяйств с лучшими почвами и большое число — с худшими, то средняя урожайность в первой группе окажется выше и станет возможным измерить достаточно точно параметры корреляционной связи. Какое именно число явлений достаточно для анализа корреляционной и вообще статистической связи, зависит от цели анализа, требуемой точности и надежности параметров связи, от числа факторов, корреляция с которыми изучается. Обычно считают, что число наблюдений должно быть не менее чем в 5-6, а лучше в 10 раз больше числа факторов[19]. Еще лучше, если число наблюдений в сотни раз больше числа факторов, тогда закон больших чисел обеспечивает эффективное взаимопогашение случайных отклонений от закономерного характера связи признаков. Вторым условием закономерного проявления корреляционной связи служит условие, обеспечивающее надежное выражение закономерности в средней величине. Кроме уже указанного большого числа единиц совокупности для этого необходима достаточная однородность совокупности. Нарушение этого условия может извратить параметры корреляции. Например, в массе зерновых хозяйств уровень продукции с 1 га растет по мере концентрации площадей, т.е. он выше в крупных хозяйствах. В массе овощных и овощемолочных хозяйств (пригородный тип) наблюдается та же прямая связь уровня продукции с размером хозяйства. Но если соединить в общую неоднородную совокупность те и другие хозяйства, то связь уровня продукции с размером площади пашни (или посевной площади) получится обратной. Причина в том, что овощные и овощемолочные хозяйства, имея меньшую площадь, чем зерновые, производят больше продукции с 1 га ввиду большей интенсивности производства в данных отраслях. В качестве третьего условия корреляционного анализа выдвигается необходимость подчинения распределения совокупности по результативному и факторным признакамнормальному закону распределения вероятностей. Это условие связано с применением метода наименьших квадратов при расчете параметров корреляции: только при нормальном распределении метод наименьших квадратов дает оценки параметров, отвечающих принципам максимальногоправдоподобия. На практике эта предпосылка чаще всего выполняется приближенно, но и тогда метод наименьших квадратов дает неплохие результаты. Однако при значительном отклонении распределений признаков от нормального закона нельзя оценивать надежность выборочного коэффициента корреляции, используя параметры нормального распределения вероятностей или распределения Стьюдента. Еще одним спорным вопросом является допустимость применения корреляционного анализа к функционально связанным признакам. Можно ли, например, построить уравнение корреляционной зависимости размеров выручки от продажи картофеля, от объема продажи и цены? Ведь произведение объема продажи и цены равно выручке в каждом отдельном случае. Как правило, к таким жестко детерминированным связям применяют только индексный метод анализа. Однако на этот вопрос можно взглянуть и с другой точки зрения. При индексном анализе выручки предполагается, что количество проданного картофеля и его цена независимы друг от друга, потому-то и допустима абстракция от изменения одного фактора при изменении влияния другого, как это принято в индексном методе. В практике изучения связи между признаками, нередко применяю корреляционно-регрессионный анализ, который позволяет учесть межфакторные связи, следовательно, дает более полное измерение роли каждого фактора: прямое, непосредственное его влияние на результативный признак; косвенное влияние фактора через его влияние на другие факторы; влияние всех факторов на результативный признак[19]. При рассмотрении корреляционной связи в научной практике, нередко рассматривают частную, множественную корреляцию и следовательно множественную регрессию. Как отмечалось раньше в нашей работе, на изучаемый признак может влиять не один, а множество факторов. В связи с этим нередко в социально-экономических исследованиях возникает задача изолированного измерения тесноты связи результативного признака с каждым из признаков-факторов в отдельности от других признаков-факторов, что демонстрирует важность применения корреляционного анализа в изучении социально-экономических процессов. 2. Проектная часть.2.1. Пример эконометрического исследования уровня бедности в России.По данным федеральной государственной службы статистики (Росстат) был построен по России ряд динамики доли населения с денежными доходами ниже величины прожиточного минимума (Yt) и дефицита денежного дохода (в процентах от общего объема денежных доходов населения, Xt) за период 1992-2014 гг.Таблица 1Исходные данныеГОДДоля населения с денежными доходами ниже величины прожиточного минимума, (Yt)Дефицит денежного дохода: в процентах от общего объема денежных доходов населения, Xt199233,56,2199331,35,4199422,43,1199524,83,9199622,13,2199720,82,8199823,43,5199928,44,9200029,05,0200127,54,5200224,63,7200320,32,6200417,62,1200517,82,1200615,21,6200713,31,3200813,41,3200913,01,2201012,51,2201112,71,2201210,70,9201310,80,9201411,21,0На основе представленных данных, применим корреляционный метод Анализ исходных данныхПостроим графики зависимостей x(t), y(t), y(x) (рис. 1-3):Рис.1: Точечный график дефицита денежного дохода населения РФРис.2: Точечный график доли населения с денежными доходами ниже прожиточного минимума в зависимости от фактора времениРис.3: Точечный график доли населения с денежными доходами ниже прожиточного минимума в зависимости от фактора хВыводы: Графический анализ исходных данных показывает, что для построения прогнозной модели может быть использована модель регрессии линейного вида = a0 + a1x.2.2. Построение корреляционно-регрессионной модели В соответствии с методом наименьших квадратов (МНК) для определения коэффициентов регрессии a0 и a1 решим систему уравнений:na0 + a1x = ya0x + a1x2 = xyИсходя из табл. 1 (см. приложения), система уравнений численными значениями параметров имеет вид:23a0 + 63,6a1 = 456,363,6a0 + 234,16a1 = 1515,21Решим систему уравнений по правилу Крамера:D0 = =5385,68– 4044,96= 1340,72D1 = = 106847,21– 96367,356 = 10479,852D3 = = 34849,83– 29020,68=5829,15a0 = 7,817a1 = 4,348.Вывод: Модель регрессии с численными оценками коэффициентов имеет вид: =7,817 + 4,348xАнализ остатков моделиОпределим остатки по формуле (cм. табл. 2): ei = yi - Визуальный анализ остатковРис.4: Точечный график остатков моделиВывод: Наличие выбросов в остатках Графический анализ остатков показывает, что гипотеза о случайности и независимости остатков не принимается.Корреляционный анализПроведем визуальный анализ взаимосвязи показателей x и y на основе графика корреляционного поля (рис. 5).Рис.5: Точечный график зависимости х от уНа рисунке 5 прослеживается определенная взаимосвязь в изменении значений y при изменении величин x в сторону увеличения. Форму взаимосвязи можно считать линейной.Вывод: Визуальный анализ графика корреляционного поля показателей x и y показал, что взаимосвязь показателей наблюдается: с изменением одного показателя меняется другой, причем взаимосвязь прямая: с увеличением показателя x наблюдается увеличение показателя y. Форму взаимосвязи можно считать линейной. Расчет коэффициента корреляцииРасчет коэффициента корреляции выполним по формуле: .Величина коэффициента корреляции равна: = (65,8 8-( 2,8* 19,8))/ (122,)^0,5 = 0,995.Вывод: Величина коэффициента корреляции rxy = 0,995 свидетельствует о сильной прямой связи между показателями x и y. Статистическая значимость коэффициента корреляцииВыполняем проверку статистической значимости коэффициента корреляции с помощью t-статистики: = 0,995*(23^0,5) 0,05 = 95,349 95,4.tтабл. ( = 0,05; n-k-1 = 21) = 2,079.Сравним tрасч. и tтабл.: tрасч. > tтабл.Вывод: Проверка статистической значимости коэффициента корреляции rxy показывает, что коэффициент корреляции rxy (0,995) значимо отличен от нуля.Общий вывод: Корреляционный анализ показал, что между показателями x и y имеется значимая взаимосвязь. Однако следует отметить, что очевидное наличие во временных рядах x(t) и y(t) трендов (см. рис. 1, 2) требует проведения более строгого корреляционного анализа взаимосвязи показателей.Проверка качества модели регрессииАнализ коэффициентов регрессииВычисление среднеквадратической ошибки коэффициентов регрессии.,где b22 = n / D0 = 23 / 1340,72 = 0,017; = 11,109. = = 0,095.Вывод: Среднеквадратическая ошибка коэффициента регрессии a1 равна 0,095.Проверка статистической значимости коэффициентов регрессии.Рассчитаем значение t-статистики tрасч и сравним с tтабл. = 4,3478/0,095 45,639 . = 2,08. >Вывод: Коэффициент модели регрессии статистически значим. Фактор x оказывает статистически значимое воздействие на изменение y. Его следует включить в модель.Построение доверительных интервалов для коэффициентов регрессииa1 – tтабл. Sa1 α1 a1 + tтабл. Sa14,3478 – 2,08*0,095 α 1 4,3478 + 2,08*0,0954,15 α 1 4,54Вывод: Доверительный интервал для истинного коэффициента регрессии α1 – [4,15; 4,54].Общий вывод: Коэффициент регрессии a1 статистически значим. Доверительный интервал для α1 – [4,15; 4,54].Проверка адекватности модели – анализ качества модели в целомОпределение коэффициента детерминации. R2 = 1 – ,где e2 = 11,109; y = y = 19,839.R2 = 1 – 0,009 = 0,991.Вывод: На 99 % вариация признака y (доля населения с денежными доходами ниже величины прожиточного минимума) объясняется влиянием фактора x (дефицита денежного дохода в процентах от общего объема денежных доходов населения).Оценка статистической значимости R2Проверяем нулевую гипотезу о том, что коэффициент детерминации в генеральной совокупности равен нулю. Проверку гипотезы осуществляем с помощью F-критерия (критерия Фишера). Для k =1 – число факторов в модели:Fрасч. = = 0,99(21)/(1-0,99) = 2083,034.Fтабл.(, n-k-1, k) = tтабл.(0,05; 21; 1) = 4,32.Fрасч. > Fтабл.(, n-k-1, k).Вывод: Проверка статистической значимости коэффициента детерминации R2 показывает, что R2 значимо отличается от нуля. Нулевая гипотеза отклоняется с заданным уровнем доверительной вероятности = 0,05.Общий вывод: Построенная для прогноза регрессионная модель адекватна.Экстраполяция по отношению к признаку x Графический анализВизуальный анализ графика x(t) рис.1 дает основание для выбора линейной модели тренда: x(t) = a0 + a1t.Вывод: На основе графического анализа можно выдвинуть гипотезы: а) о наличии тенденции (линейного тренда), б) линейности тренда. Определение формы зависимости тренда (подтверждение гипотезы о линейности тренда)Для проверки линейности тренда воспользуемся методом конечных разностей (табл. 5- см. приложения):Вывод: Средняя арифметическая конечных разностей близка к нулю. Метод конечных разностей подтверждает линейность тренда. Общий вывод: Аналитические критерии оценки временного ряда x(t) подтверждают наличие в нем линейного тренда. Для последующего анализа продолжим использовать модель линейного тренда:(t) = a0 + a1tОпределение параметров тренда Для определения параметров тренда a0 и a1 используем МНК, в соответствии с которым решим систему уравнений: na0 + a1t = xa0t + a1t2 = tx.Необходимые расчеты числовых значений коэффициентов системы линейных уравнений отражены в приложении. 23 a0 + 276a1 = 63,6a1 = (63,6-23 a0 )/276 276 a0 + 4324a1 = 554a0 = (554-432 ((63,6-23 a0 )/276) )/276 a0 = 5,246 a1 = a1 = (63,6-23*5,246)/276 = -0,207.Вывод: Таким образом, линейное уравнение тренда имеет вид:(t) = 5,246 - 0,207 tПроверка качества модели трендаПроверим качество полученной модели на основе оценки средней относительной погрешности: = 0,242 0,24.Вывод: Относительная погрешность 24% умеренно значительная (могла бы быть лучше). Модель адекватна. Общий вывод: Линейное уравнение тренда имеет вид: (t) = 5,246 - 0,207 t.Качество модели удовлетворительное.

Список литературы

1. Эконометрика: учебник для магистров / И.И. Елисеева [и др.]; под ред. И.И. Елисеевой. – М.: Издательство Юрайт, 2014. – 449с. – Серия: Магистр.
2. Эконометрика. Учебное пособие / А.В. Костромин, Р.М. Кундакчян / Издательство: Кнорус, 2015 г., – 228с. ISBN: 978-5-406-00856-0
3. Эконометрика. Учебник. / В.С. Мхитарян, М.Ю. Архипова, В.А.Балаш / Редактор: Мхитарян Владимир Сергеевич. Издательство: Проспект, 2014 г. – 384 с. ISBN: 978-5-392-00188-0
4. Новиков, А.И. Эконометрика [Текст]: учеб. пособие по напр. "Финансы и кредит", "Экономика" - М.: Дашков и К, 2013. - 223 с. - (93895-1) (У; Н 73)
5. Новиков, А.И. Эконометрика [Электронный ресурс]: учеб. пособие - М.: Дашков и К, 2013. - Лань. - (104974-1) (У; Н 73)
6. Кремер Н.Ш., Путко Б.А. Эконометрика: Учебник для вузов / Под ред. проф. Н.Ш. Кремера. – М.: ЮНИТИ- ДАНА, 2010.
7. Эконометрика: теория и практика / А.Н. Герасимов, Е.И. Громов, А.В. Гладилин – Издательство: Кнорус, 2010 г. Серия: Электронный учебник. ISBN: 978-5-406-00186-8
8. Эконометрика: учебник / И.И. Елисеева, С.В. Курышева, Т.В. Костеева и др., Под ред. И.И. Елисеевой.- 2-е изд., перераб. И доп. – М.: Финансы и статистика, 2006.- 576с.
Очень похожие работы
Пожалуйста, внимательно изучайте содержание и фрагменты работы. Деньги за приобретённые готовые работы по причине несоответствия данной работы вашим требованиям или её уникальности не возвращаются.
* Категория работы носит оценочный характер в соответствии с качественными и количественными параметрами предоставляемого материала. Данный материал ни целиком, ни любая из его частей не является готовым научным трудом, выпускной квалификационной работой, научным докладом или иной работой, предусмотренной государственной системой научной аттестации или необходимой для прохождения промежуточной или итоговой аттестации. Данный материал представляет собой субъективный результат обработки, структурирования и форматирования собранной его автором информации и предназначен, прежде всего, для использования в качестве источника для самостоятельной подготовки работы указанной тематики.
bmt: 0.00502
© Рефератбанк, 2002 - 2024