* Данная работа не является научным трудом, не является выпускной квалификационной работой и представляет собой результат обработки, структурирования и форматирования собранной информации, предназначенной для использования в качестве источника материала при самостоятельной подготовки учебных работ.
СОДЕРЖАНИЕ
1. Введение
2. Роль корреляцонно-регрес сионного анализа в обработке экономических да нных
3. Корреляци онно-регрес сионный анализ и его возможности
4. Предпосылки корреляционн ого и регрессионного анализа
5. Пакет анализа Microsoft Excel
6. Заключение
7. Литература
Введе ние
Обработка стат истических данных уже давно применяется в самых разнообразных видах человеческой д еятельности . Вообще говоря , трудно назвать ту сферу , в которой она бы не использова лась . Но , пожалуй , ни в одной области з наний и практической деятельности обработка с татистических данных не играет такой исключи тельно большой роли , как в эк о номике , имеющей дело с обработкой и анализ ом огромных массивов информации о социально-э кономических явлениях и процессах . Всесторонний и глубокий анализ этой информации , так называемых статистических данных , предполагает ис пользование различных специальны х метод ов , важное место среди которых занимает ко рреляционный и регрессионный анализы обработки статистических данных.
В экономических исследованиях часто решаю т задачу выявления факторов , определяющих уро вень и динамику экономического процесса . Така я задач а чаще всего решается методами корреляционного и регрессионного анализа . Дл я достоверного отображения объективно существующ их в экономике процессов необходимо выявить существенные взаимосвязи и не только выя вить , но и дать им количественную оценку . Этот п о дход требует вскрытия причинных зависимостей . Под причинной зависимос тью понимается такая связь между процессами , когда изменение одного из них является следствием изменения другого.
Основными задачами корреляционного анализа являются оценка силы связи и п рове рка статистических гипотез о наличии и си ле корреляционной связи . Не все факторы , в лияющие на экономические процессы , являются с лучайными величинами , поэтому при анализе эко номических явлений обычно рассматриваются связи между случайными и неслучайным и величинами . Такие связи называются регрессионны ми , а метод математической статистики , их изучающий , называется регрессионным анализом.
Использование возможностей современной вычис лительной техники , оснащенной пакетами программ машинной обработки статистич еской информац ии на ЭВМ , делает практически осуществимым оперативное решение задач изучения взаимосвязи показателей биржевых ставок методами коррел яционно-регрессионного анализа.
При машинной обработке исходной информаци и на ЭВМ , оснащенных пакетами станд арт ных программ ведения анализов , вычисление пар аметров применяемых математических функций являе тся быстро выполняемой счетной операцией.
Данная работа посвящена изучению возможно сти обработки статистических данных биржевых ставок методами корреляционного и регрессио нного анализа с использованием пакета приклад ных программ Microsoft Excel .
Роль корреляцонно-регрессионного анализа в обработке экономических данных
Корреляционный анализ и регрессионный ана лиз являются смежными разделами математической стат истики , и предназначаются для изуче ния по выборочным данным статистической завис имости ряда величин ; некоторые из которых являются случайными . При статистической зависимос ти величины не связаны функционально , но к ак случайные величины заданы совместным ра с пределением вероятностей . Исследование взаимосвязи случайных величин биржевых ставок приводит к теории корреляции , как разделу теории вероятностей и корреляционному анализ у , как разделу математической статистики . Иссл едование зависимости случайных величин приводит к моделям регрессии и регрес сионному анализу на базе выборочных данных . Теория вероятностей и математическая статистик а представляют лишь инструмент для изучения статистической зависимости , но не ставят своей целью установление причинной связи . П р едставления и гипотезы о причинн ой связи должны быть привнесены из некото рой другой теории , которая позволяет содержат ельно объяснить изучаемое явление.
Формально корреляционная модель взаимосвяз и системы случайных величин может быть представлена в сле дующем виде : , где Z – набор случа йных величин , оказывающих вли яние на и зучаемые случайные величины.
Экономические данные почти всегда представлены в виде т аблиц . Числовые данные , содержащиеся в таблица х , обычно имеют между собой явные (известн ые ) или неявные (скрытые ) связи .
Явно связаны показатели , которые получены методами прямого счета , т . е . вычисле ны по заранее известным формулам . Например , проценты выполнения плана , уровни , удельные веса , отклонения в сумме , отклонения в про центах , темпы роста , темпы прироста , индексы и т . д .
Связи же второго типа (неявные ) за ранее неизвестны . Однако необходимо уметь объяснять и предсказывать (прогнозировать ) сл ожные явления для того , чтобы управлять им и . Поэтому специалисты с помощью наблюдений стремятся выявить скрытые зависимости и вы разить их в виде формул , т . е . математи ч е ски смоделировать явления или п роцессы . Одну из таких возможностей предостав ляет корреляционно-регрессионный анализ .
Математические модели строятся и использу ются для трех обобщенных целей :
• для объяснения ;
• для предсказания ;
• для управления .
Предс тавление экономических и других данных в электронных таблицах в наши дни стало простым и естественным . Оснащение же электронных таблиц средствами корреляцион но-регрессионного анализа способствует тому , что из группы сложных , глубоко научных и по тому редко используемых , почти экзотич еских методов , корреляционно-регрессионный анализ превращается для специалиста в повседневный , эффективный и оперативный аналитический инструме нт . Однако , в силу его сложности , освоение его требует значительно больших знаний и у с илий , чем освоение простых электронных таблиц .
Пользуясь методами корреляционно-регрессионного анализа , аналитики измеряют тесноту связей показателей с помощью коэффициента корреляции . При этом обнаруживаются связи , различные по силе (сильные , слабые , уме ренные и др .) и различные по направлению (прямые , обр атные ). Если связи окажутся существенными , то целесообразно будет найти их математическое выражение в виде регрессионной модели и оценить статистическую значимость модели . В экономике значимое уравнение использует ся , как правило , для прогнозирования изучаемог о явления или показателя .
Регрессионный анализ называют основным ме тодом современной математической статистики для выявления неявных и завуалированных связей между данными наблюдений . Электронные таб лицы делают такой анализ легко доступ ным . Таким образом , регрессионные вычисления и подбор хороших уравнений - это ценный , уни версальный исследовательский инструмент в самых разнообразных отраслях деловой и научной деятельности (маркетинг , торговля , медиц и на и т . д .). Усвоив технологию испол ьзования этого инструмента , можно применять е го по мере необходимости , получая знание о скрытых связях , улучшая аналитическую поддер жку принятия решений и повышая их обоснов анность .
Корреляционно-регрессионный анализ сч итае тся одним из главных методов в маркетинге , наряду с оптимизационными расчетами , а т акже математическим и графическим моделированием трендов (тенденций ). Широко применяются как однофакторные , так и множественные регрессионны е модели .
Корреляционно-рег рессионный ана лиз и его возможности
Корреляционный анализ является одним из методов статистич еского анализа взаимосвязи нескольких признаков.
Он определяется как метод , при меняемый тогда , когда данные наблюдения можно считать случайными и выбранными из г енеральной совокупности , распределенной по многомерному нормальному закону . Основная задач а корреляционного анализа (являющаяся основной и в регрессионном анализе ) состоит в оц енке уравнения регрессии.
Корреляция – это статистическая зависимость между случ айными величинами , не имеющими строго функционального характер а , при которой изменение одной из случайны х величин приводит к изменению математическог о ожидания другой.
1. Парная корреляция – связь между двумя признаками (результативн ым и факторным или дву мя факторными ).
2. Частная корреляция – зависимость между результативным и одним факторным признаками при фиксированном значе нии других факторных признаков.
3. Множественная корреляци я – зависимость результативного и двух и ли более факторных признаков , в ключенных в исследование.
Корреляционный анализ имеет своей задачей количественное определение тесноты связи между двумя признак ами (при парной связи ) и между результатив ным признаком и множеством факторных признако в (при многофакторной связи ).
Теснота свя зи количественно выражаетс я величиной коэффициентов корреляции . Коэффициент ы корреляции , представляя количественную характер истику тесноты связи между признаками , дают возможность определить «полезность» факторных признаков при построении уравнений множес т венной регрессии . Величина коэффициентов корреляции служит также оценкой соответствия уравнению регрессии выявленным причинно-следственным связям.
Первоначально исследования корреляции провод ились в биологии , а позднее распространились и на другие области, в том числ е на социально-экономическую . Одновременно с к орреляцией начала использоваться и регрессия . Корреляция и регрессия тесно связаны между собой : первая оценивает силу (тесноту ) стати стической связи , вторая исследует ее форму . И корреляция , и регре с сия служа т для установления соотношений между явлениям и и для определения наличия или отсутстви я связи между ними.
Предп осылки корреляционного и регрессионного анализа
Перед рассмотрением предпосылок корреляционного и регрессионного анализа , следует сказ ать , что общим условием , позволяю щим получить более стабильные результаты при построении корреляционных и регрессионных мо делей биржевых ставок , является требование од нородности исходной информации . Эта информация должна быть обработана на предмет аномаль н ых , т.е . резко выделяющихся из массива данных , наблюдений . Эта процедура выпо лняется за счет количественной оценки однород ности совокупности по какому-либо одномерному или многомерному критерию (в зависимости от исходной информации ) и имеет цель тех о бъек т ов наблюдения , у которых наил учшее (или наихудшее ) условия функционирования по не зависящим или слабо зависящим пр ичинам.
После обработки данных на предмет «ан омальности» следует провести проверку , насколько оставшаяся информация удовлетворяет предпосылка м для использования статического аппарата при построении моделей , так как даже не значительные отступления от этих предпосылок часто сводят к нулю получаемый эффект . Сле дует иметь ввиду , что вероятностное или с татистическое решение любой экономической зад а чи должно основываться на подроб ном осмыслении исходных математических понятий и предпосылок , корректности и объективности сбора исходной информации , в постоянном соч етании с теснотой связи экономического и математико-статистического анализа.
Для применени я корреляционного анализ а необходимо , чтобы все рассматриваемые перем енные были случайными и имели нормальный закон распределения . Причем выполнение этих у словий необходимо только при вероятностной оц енке выявленной тесноты связи.
Рассмотрим простейшие слу чай выявлени я тесноты связи – двумерную модель корре ляционного анализа.
Для характеристики тесноты связи между двумя переменными обычно пользуются парным коэффициентом корреляции , если рассматриват ь генеральную совокупность , или его оценкой – выборочным парным коэффициентом , если изучается выборочная совокупность . Парный коэффициент корреляции в случае линейной формы связи вычисляют по формуле
,
а его выборочное значение – по ф ормуле
При малом числе наблюдений выборочный коэффициент корреляции удобно вычис лять по следующей формуле :
Величина коэфф ициента корреляции изменяется в интервале .
При между двумя переменными существует функциональная связь , пр и - прямая функционал ьная связь . Если , то значение Х и У в выборке некоррелированы ; в случ ае , если система случайных величин и меет двумерное нормальное распределение , то величины Х и У будут и независимыми.
Если коэффициент корреляции находится в интервале , то между вели чинами Х и У существует обратная ко рреляционная связь . Это находит подтверждение и при визуальном анализе исходной информации . В этом случае отклонение величины У от среднего значения взяты с обратным зна ком.
Если каждая пара значений величин Х и У чаще всего одновреме нно оказыв ается выше (ниже ) соответствующих средних знач ений , то между величинами существует прямая корреляционная связь и коэффициент корреляции находится в интервале .
Если же отклонение величины Х от среднего значения одинаково часто вызывают от клонения величины У вниз от среднего знач ения и при этом отклонения оказываются вс е время различными , то можно предполагать , что значение коэффициента корреляции стре мится к нулю.
Следует отметить , что значение коэффициен та корреляции не зависит от единиц измере ния и выбора начала отсчета . Это означает , что если переменные Х и У уменьшить (увеличить ) в К раз либо на одно и число С , то коэффициент корреля ции не из менится.
Пакет анализа Microsoft Excel
В состав Microsoft Excel входит набор средств анализа данных (так называемый пакет анализа ), предназначенный дл я решения сложных статистических и инженерных задач . Для проведения анализа данных с помощью этих инстру ментов следует указ ать входные данные и выбрать параметры ; ан ализ будет проведен с помощью подходящей статистической или инженерной макрофункции , а результат будет помещен в выходной диапазон . Другие средства позволяют представить резул ьтаты анализа в гра ф ическом виде.
Графические изображения используются прежде всего для наглядного представления статистических данных , благодаря им существенно облегчается их восприятие и понимание . Су щественна их роль и тогда , когда речь идет о контроле полноты и достоверно с ти исходного статистического материала , используе мого для обработки и анализа .
Статистические данные приводятся в виде длинных и сложных статистических таблиц ( см ., например , табл .1), поэтому бывает весьма трудно обнаружить в них имеющиеся неточности и о шибки.
Графическое же представление статистических данных помогает легко и быстро выявить ничем не оправданные пики и впадины , яв но не соответствующие изображаемым статистически м данным , аномалии и отклонения . На график е , построенном по данным таблицы 1 (р ис .1), наглядно показано распределение курса бирж евых ставок в зависимости от времени сове ршения сделки и цены сделки в рублях .
Графическое представление статистических дан ных является не только средством иллюстрации статистических данных и контроля их п равильности и достоверности . Благодаря св оим свойствам оно является важным средством толкования и анализа статистических данных , а в некоторых случаях - единственным и незаменимым способом их обобщения и познан ия . В частности , оно незаменимо при одновр еме н ном изучении нескольких взаимосвя занных экономических явлений , так как позволя ет с первого взгляда установить существующие между ними соотношения и связи , различие и подобие , а также выявить особенности их изменений во времени .
Однако , чтобы эффективнее и спользоват ь графические изображения статистических данных , необходимо овладеть методикой и техникой их построения . К этому следует добавить , что построенное графическое изображение стати стических данных биржевых ставок в наибольшей степени соответствует характеру и содержанию изображаемых данных и поставленно й задаче их анализа.
Время Цена сделки
в рублях 11:16:45 99,45 11:21:53 99,4 11:23:09 99,31 11:23:37 99,31 11:24:49 99 11:24:57 99 11:48:40 98,61 11:49:45 98,99 11:53:51 98,66 11:55:05 98,65 11:55:24 98,7 11:58:18 98,8 11:58:18 98,8 11:58:24 98,65 11:58:35 98,8
Таблица 1. Выборк а биржевых ставок относительно времени соверш ения сделки и цены сделки в рублях за один день работы биржи
Рис .1 Распределение курса биржевых ставок в зависимости от времени совершения сделки и цены сделки в рублях .
Корреляция - о дин из инструментов пакета анализа Mi crosoft Excel . Используется для количественной оценки взаимосвязи двух набор ов данных , представленных в безразмерном виде . Коэффициент корреляции выборки представляет собой ковариацию двух наборов данных , деленну ю на произведение их стандартных отклонений.
Корреляционный анализ дает возможность ус тановить ассоциированы ли наборы данных по величине , то есть : большие значения из о дного набора данных связаны с большими зн ачениями другого набора (положительная корреляция ); или , наоборот , малые значения одного н абора связаны с большими значениями д ругого (отрицательная корреляция ); или данные д вух диапазонов никак не связаны (корреляция близка к нулю ).
Регрессия так же является инструментом пакета анализа данны х Microsoft Excel .. Лин ейный регрессионный анализ зак лючается в подборе графика для набора наблюдений с помощью метода наименьших квадратов . Регресс ия используется для анализа воздействия на отдельную зависимую переменную значений одной или более независимых переменных . Например , на курс биржевых ставок вли я ют несколько факторов , включая такие , как вр емя совершения сделки и ее цена . Регресси я пропорционально распределяет меру качества по этим двум факторам на основе данных функционирования курса биржевых ставок . Результ аты регрессии могут быть использованы д ля предсказания качеств новых , не сове ршенных еще биржевых сделок . Например , использ уя результаты таблицы 1, можно с помощью ре грессии предсказать цены следующих сделок.
Наблюдение Предсказа нная цена сделки в рублях Остатки 1 72,22015 27,22985 2 72,76796 26,63204 3 72,90313 26,40687 4 72,95293 26,35707 5 73,08099 25,91901 6 73,09522 25,90478 7 75,62617 22,98383 8 75,74178 23,24822 9 76,17932 22,48068 10 76,31094 22,33906 11 76,34473 22,35527 12 76,65421 22,14579 13 76,65421 22,14579 14 76,66488 21,98512 15 76,68444 22,11556
Табл .2. Предсказанная цена сделки в рубл ях
Заключение
Наиболее сложным этапом , завершающ им регрессионный анализ , является интерпретация полученных результатов , т.е . перевод их с языка статистики и математики на язык экономики.
Интерпретация моделей регрессии о существляется методами той отрасли знаний , к которой относятся исследуемые явления . Всяка я интерпретация начинается со статистической оценки уравнения регрессии в целом и оцен ки значимости входящих в модель факторн ых признаков , т.е . с изучения , как они в лияют на величину результативного признака . Ч ем больше величина коэффициента регрессии , те м значительнее влияние данного признака на моделируемую обработку биржевых ставок . Особое значение при этом имеет зна к перед коэффициентом регрессии . Знаки коэффициен тов регрессии говорят о характере влияния на результативный признак статистической обраб отки биржевых ставок . Если факторный признак имеет плюс , то с увеличением данного фактора результативный признак возрас т ает ; если факторный признак со знаком минус , то с его увеличением результативны й признак уменьшается . Интерпретация этих зна ков полностью определяется социально-экономическим содержанием моделируемого признака . Если его величина изменяется в сторону увели ч ения , то плюсовые знаки факторных приз наков имеют положительное влияние . При измене нии результативного признака в сторону снижен ия положительные значения имеют минусовые зна ки факторных признаков . Если экономическая те ория подсказывает , что факторный приз н ак должен иметь положительное значение , а он со знаком минус , то необходимо проверить расчеты параметров уравнения регресс ии.
Корреляционный и регрессионный анализ поз воляет определить зависимость между факторами , а так же проследить влияние задействованны х факторов . Эти показатели имеют широк ое применение в обработке статистических данн ых для достижения наилучших показателей бирже вых ставок.
Литература
1. В.А . Колемаев , О.В . Староверов , В.Б . Турунд аевский «Теория
веро ятностей и математическа я сатистика» / М ., 1991.
2. «Теория Статистики» под редакцией Р.А . Шмойловой / «ФиС» , 1998.
3. «Многомерный статистиче ский анализ на Э BM с использованием
пакета Microsoft Excel» / М ., 1997.
4. А.А . Френкель , Е.В . Адамова «Корреляционно регрессионный
а нализ в экономических приложениях» / М ., 1987.
5. И.Д.Одинцов «Теория с татистики» / М ., 1998.
6. А.Н . Кленин , К.К . Ш евченко «Математическая статистика для
экономистов-статис тиков» / М ., 1990.