Вход

Исследование проблемы мультиколлинеарности

Рекомендуемая категория для самостоятельной подготовки:
Курсовая работа*
Код 233794
Дата создания 10 июня 2016
Страниц 21
Мы сможем обработать ваш заказ (!) 30 мая в 12:00 [мск]
Файлы будут доступны для скачивания только после обработки заказа.
1 100руб.
КУПИТЬ

Описание

В курсовой рассмотрены различные тесты. За работы получил 5. ...

Содержание

СОДЕРЖАНИЕ

ВВЕДЕНИЕ 3
1.МУЛЬИКОЛЛИНЕАРНОСТЬ: СХОЖЕСТЬ ОБЪЯСНЯЮЩИХ ПЕРЕМЕННЫХ 4
2.ПРОВЕДЕНИЕ РАСЧЕТОВ НА МУЛЬТИКОЛЛИНЕАРНОСТЬ 11
2.1.ТЕСТ НА МУЛЬТИКОЛЛИНЕАРНОСТЬ ФАРРАРА-ГЛОБЕРА 12
2.2.ТЕСТ НА ВЫБОР ДЛИННОЙ ИЛИ КОРОТКОЙ РЕГРЕССИИ 13
2.3.ТЕСТ ЧОУ НА ОДНОРОДНОСТЬ ДАННЫХ 14
2.4.ТЕСТ ГОЛЬДФЕЛЬДА-КУАНДТА 16
2.5.ТЕСТ БРЕУША-ПАГАНА 17
2.6.ТЕСТ УАЙТА 18
2.7.ТЕСТ ДАРБИНА-УОТСОНА 18
ЗАКЛЮЧЕНИЕ 20
СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ 22

Введение

Проблема построения устойчивых прогностических моделей, предназначенных для длительной эксплуатации возникает при решении задач прогнозирования состояний технических, биологических и социальных систем. Одной из основных причин неустойчивости моделей является наличие мультиколлинеарности результатов измерений. Одним из способов устранения мультиколлинеарности и повышения устойчивости модели является отбор наиболее значимых признаков. Определение наиболее оптимального метода выбора признаков для конкретной задачи являвется актуальной проблемой машинного обучения.
Предмет исследования – проблема мультиколлинеарности. Объектом ислледования выступают эконометрические модели.
Целью является выявление факторов, влияющих на величину прожиточного минимума в РФ, а также установление характера взаимо связи.
Задачи данной курсовой работы:
1. Рассмотреть теоретические аспекты проблем мультиколлинеарности
2. Рассмотреть различные тесты

Фрагмент работы для ознакомления

73
число наблюдений
k
8
число независимых переменных
q
5
число исключ переменных
Alpha
0,05
уровень значимости
ESSur
5284273
длинная регрессия
ESSr
6021843
короткая регрессия
FLSнабл
1,786602
наблюдаемое значение статистики
FLSкрит
2,358318
критическое значение статистики
Т.к. FLSнабл меньше, чем FLSкрит, то H0 - принимается, используем короткую модель
2.3.ТЕСТ ЧОУ НА ОДНОРОДНОСТЬ ДАННЫХ
Данный тест проводится для установления: есть ли возможность использовать общую модель для всех данных в модели, «выигравшей» в тесте на «длинную-короткую» модель, либо необходимо использовать разные модели. Однако тест Чоу не говорит нам, в чем именно должно будет заключаться различие в двух моделях, если они должны быть.
Строится регрессия победившей в тесте «длинная-короткая» модели, определяется содержательное основание для разделения всех данных по группам. После разделения упорядочивают данные по этому основанию. Для каждой из двух полученных групп наблюдений строится регрессия, находится сумма квадратов остатков, и вычисляются наблюдаемое и критическое значения статистики Фишера. Далее эти величины сравниваются, и делается вывод о принятии/отклонении нулевой гипотезы об однородности данных, т.е. о возможности использования единой модели.
Если наблюдаемое значение больше критического, то нулевая гипотеза отклоняется, альтернативная принимается, значит, данные неоднородны и необходимо использовать две разных модели.
В моем случае, данные были поделены на две подгруппы: Юг, Поволжье и Центр (где развито сельское хозяйство и благоприятные климатические условия), и остальные регионы. FCHнабл=2,35 больше FCHкрит=2,06, нулевая гипотеза отклоняется, нужно использовать две разные модели.
Далее необходимо установить, существует ли зависимость дисперсии случайных возмущений от какого-либо конкретного показателя – провести тест на гетероскедастичность.
Среди наиболее известных тестов на гетероскедастичность являются тесты «Гольдфельда-Куандта», «Бреуша-Пагана», «Уайта». Принципиальным отличием первых двух является условие применения каждого. Так, по тесту «Гольдфельда-Куандта» определяют, зависит ли дисперсия случайных возмущений от фактора, включенного в модель, а в тесте «Бреуша-Пагана» - от не включенного показателя. Последний же тест, определяет не конкретного «подозреваемого», а наличие квадратичной форме зависимости одновременно от всех показателей, включенных в модель.
Таблица 4. Тест Чоу
H0
данные однородны
k
3
число независимых переменных
n
41
число наблюдений 1
m
32
число наблюдений 2
ESSr
6021843
короткая регрессия
ESS1
1525785,351
регрессия 1
ESS2
2821229,331
регрессия 2
ESSur
4347014,681
ESS1+ESS2
FCHнабл
2,354503654
наблюдаемое значение статистики
FCHкрит
2,055161071
критическое значение статистики
Т.к. FCHнабл больше, чем FCHкрит, то H0 - отвергается, данные неоднородны
2.4.ТЕСТ ГОЛЬДФЕЛЬДА-КУАНДТА
Для выполнения теста «Гольдфельда-Куандта» берется победившая в ходе прошлых тестов модель (в моем случае – короткая), из середины таблицы удаляются d=n/2 наблюдений так, чтобы получившиеся в результате этого две матрицы (сверху и снизу) имели одинаковое число наблюдений (n-d)/2. Далее строятся регрессии для каждой подгруппы, находятся ESS_1, ESS_2 и определяется, какое из этих значений является ESS_max, а какое ESS_min. Вычисляются наблюдаемое и критическое значения статистики. Если наблюдаемое значение больше критического, нулевую гипотезу о гомоскедастичности модели отклоняют.
Подозреваемого я определил по диаграмме рассеяния короткой модели: выбрал номинальную заработную плату (Х3), т.к. точки сужались вдоль тренда, т.е. я предположил, что разброс величина прожиточного минимума зависит от номинальной средней заработной платы.
В моем случае, GQнабл=2,4 больше GQкрит=2,17, т.е. нулевая гипотеза отвергается и модель гетероскедастична.
Таблица 5. Тест Гольдфельда-Куандта
Н0: модель гомоскедастична, т е дисперсия случайных возмущений не зависит от Х3 (подозреваемый)
n
73
число наблюдений
k
3
число факторов
d
19
число отбрасываемых наблюдений
alpha
0,05
уровень значимости
nGQ
27
число наблюдений в каждой подгруппе
dfGQ
19
число степеней свободы для теста GQ
ESS_GQ_1
861953,2
подгруппа 1
ESS_GQ_2
2066706
подгруппа 2
ESS_max
2066706
наибольшая
ESS_min
861953,2
наименьшая
Fстат
2,397701
наблюдаемое значение статистики
Fкрит
2,168252
критическое значение статистики
так как Fнабл > Fкрит, то H0 отвергается, модель гетероскедастична
2.5.ТЕСТ БРЕУША-ПАГАНА
Для проведения «Бреуша-Пагана» берут победившую модель, строят ее обычную регрессию, кроме подозреваемого X3, с остатками, вычисляют квадраты этих остатков, оценку дисперсии остатков, новую зависимую переменную. Далее строится регрессия Y’^ (Z), где Z – подозреваемый показатель, который определяют по диаграмме рассеяния. Из второй регрессии «Бреуша-Пагана» вычисляется наблюдаемое и критическое значения статистики.
Выводы теста делаются на основе общих правил: превышение наблюдаемого над критическим означает отклонение нулевой гипотезы о гомоскедастичности.
В моем случае, BPнабл=28,47 больше BPкрит=3,84, значит, модель гетероскедастична, дисперсия случайных возмущений зависит от некоторых дополнительных переменных, не включенных ранее в регрессионную модель
Таблица 6. Тест Бреуша-Пагана
H0
модель гомоскедастична
n
73
число наблюдений
dfBP
1
число степеней свободы, число подозреваемых
alpha
0,05
уровень значимости
RSS_BP_2
56,945
объясненная сумма квадратов для второй регрессии
ВРнабл
28,4725
наблюдаемое значение статистики
BРкрит
3,841459
критическое значение статистики
тк ВРнабл больше ВРкрит, модель - гетероскедастична

Список литературы

СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ
1. Аверкин А.Н., Батыршин И.З., Блишун А.Ф. и др. Нечеткие множества в моделях управления и искусственного интеллекта // Под ред. Д.А. Поспелова. М.: Наука, 2012. - 312 с.
2. Аветисян Д.О. Проблемы информационного поиска: (Эффективность, автоматическое кодирование, поисковые стратегии) - М.: Финансы и статистика, 2011. - 207 с.
3. Айвазян С.А., Бежаева З.И., Староверов О.В. Классификация многомерных наблюдений. - М.: Статистика, 2014. - 240 с.
4. Айвазян С.А., Енюков И.С., Мешалкин Л.Д. Прикладная статистика. Основы моделирования и первичная обработка данных. Справочное издание. М.: Финансы и статистика, 2013. - 472 с.
5. Айвазян С.А., Енюков И.С., Мешалкин Л.Д. Прикладная статистика: Исследование зависимостей: Справочник. - М.: Финансы и статистика, 2010.182с.
6. Айвазян С.А. , Мхитарян В.С. Прикладная статистика и основы эконометрики. - М. Юнити, 2008. - 1024 с.
7. Ван дер Варден Б.Л. Математическая статистика. - М.: Изд-во иностр. лит., 1960. - 302 с.
8. Гайдышев И.П. Анализ и обработка данных: специальный справочник. - СПб.: Питер, 2011. - 752 с.
9. Гмурман В.С. Теория вероятностей и математическая статистика. - М.: Высш. шк., 2012. - 368 с.
10. Калинина В.Н., Панкин В.Ф. Математическая статистика. - М.: Высш. шк., 2001. - 336 с.
11. Кендалл М., Стьюарт А. Теория распределений М.: Наука, 1966. - 566 с.
12. Кендалл М., Стьюарт А. Статистические выводы и связи. - М .: Наука, 1973. - 899 с.
Очень похожие работы
Пожалуйста, внимательно изучайте содержание и фрагменты работы. Деньги за приобретённые готовые работы по причине несоответствия данной работы вашим требованиям или её уникальности не возвращаются.
* Категория работы носит оценочный характер в соответствии с качественными и количественными параметрами предоставляемого материала. Данный материал ни целиком, ни любая из его частей не является готовым научным трудом, выпускной квалификационной работой, научным докладом или иной работой, предусмотренной государственной системой научной аттестации или необходимой для прохождения промежуточной или итоговой аттестации. Данный материал представляет собой субъективный результат обработки, структурирования и форматирования собранной его автором информации и предназначен, прежде всего, для использования в качестве источника для самостоятельной подготовки работы указанной тематики.
bmt: 0.00441
© Рефератбанк, 2002 - 2024