Вход

Статистическийанализэмпирическихраспределений

Рекомендуемая категория для самостоятельной подготовки:
Курсовая работа*
Код 208760
Дата создания 01 мая 2017
Страниц 33
Мы сможем обработать ваш заказ (!) 22 апреля в 12:00 [мск]
Файлы будут доступны для скачивания только после обработки заказа.
1 600руб.
КУПИТЬ

Описание

ЗАКЛЮЧЕНИЕ

В курсовой работе были проанализированы данные о распределении регионов России по количеству легковых автомобилей на 1000 человек населения за 2012 г. Для удобства анализа данные были представлены в виде группировочных таблиц с количеством интервалов n8, 10 и 13. Наиболее пригодной для анализа оказалась группировочная таблица с восемью интервалами.
Также для удобства анализа вариационного ряда используется графическое представление. В работе были использованы такие виды графиков, как полигон, кумулята и гистограмма. Полигон, построенный на основе абсолютных частот, показывает форму распределения. Из рисунка видно, что распределение имеет одну вершину, форма его симметрична и довольно крута.
Также с помощью графика можно определить модальный интервал (140,8–171,17). Гистограмма ...

Содержание

Оглавление
ВВЕДЕНИЕ 3
1. ТАБЛИЧНОЕ И ГРАФИЧЕСКОЕ ПРЕДСТАВЛЕНИЕ ВАРИАЦИОННОГО РЯДА 5
2. ХАРАКТЕРИСТИКА ЦЕНТРАЛЬНОЙ ТЕНДЕНЦИИ РАСПРЕДЕЛЕНИЯ 12
3. ОЦЕНКА ВАРИАЦИИ ИЗУЧАЕМОГО ПРИЗНАКА 16
4. ХАРАКТЕРИСТИКА СТРУКТУРЫ РАСПРЕДЕЛЕНИЯ 19
5. ХАРАКТЕРИСТИКА ФОРМЫ РАСПРЕДЕЛЕНИЯ 21
6. СГЛАЖИВАНИЕ ЭМПИРИЧЕСКОГО РАСПРЕДЕЛЕНИЯ. ПРОВЕРКА ГИПОТЕЗЫ О ЗАКОНЕ РАСПРЕДЕЛЕНИЯ 24
ЗАКЛЮЧЕНИЕ 30
СПИСОК ИСПОЛЬЗОВАННОЙ ЛИТЕРАТУРЫ 33


Введение

ВВЕДЕНИЕ
Статистические ряды распределения являются одним из наиболее важных элементов статистики. Они представляют собой составную часть метода статистических сводок и группировок, но, по сути, ни одно из статистических исследований невозможно произвести, не представив первоначально полученную в результате статистического наблюдения информацию в виде статистических рядов распределения.
Первичные данные обрабатываются в целях получения обобщенных характеристик изучаемого явления по роду существенных признаков для дальнейшего осуществления анализа и прогнозирования; производится сводка и группировка; статистические данные оформляются с помощью рядов распределения в таблицы, в результате чего информация представляется в наглядном рационально изложенном виде, удобном для использования и дальн ейшего исследования; строятся различного рода графики для наиболее наглядного восприятия и анализ информации. На основе статистических рядов распределения вычисляются основные величины статистических исследований: индексы, коэффициенты; абсолютные, относительные, средние величины и т.д., с помощью которых можно проводить прогнозирование, как конечный итог статистических исследований.
Актуальность данной темы обусловлена тем, что статистические ряды распределения являются базисным методом для любого статистического анализа. Понимание данного метода и навыки его использования необходимы для проведения статистических исследований.
Основной целью написания курсовой работы является изучение методики статистического анализа рядов распределения. Для достижения поставленной цели были поставлены и выполнены следующие основные задачи:
1. Освещено понятие и виды статистических рядов распределения, и основные формы их представления.
2. Рассчитаны и проанализированы показатели, характеризующие центральную тенденцию, вариацию, структуру и форму ряда распределения.
3. Проведено сглаживание эмпирического распределения и проверены гипотезы о законе распределения.
В качестве данных для анализа в курсовой работе были использованы данные о распределении регионов Российской Федерации по количеству легковых автомобилей на 1000 чел. населения за 2012 г. (из статистического сборника «Регионы России» за 2012 г.).
Методической базой для написания курсовой работы является учебное пособие Н.В. Куприенко «Статистика. Методы анализа распределений. Выборочное наблюдение». Также при написании работы были использованы и учебные пособия по основам статистики следующих авторов: И.И. Елисеевой, В.М. Гусарова, М.Р. Ефимовой и др.

Фрагмент работы для ознакомления

Иными словами, средняя арифметическая величина — среднее слагаемое. При ее вычислении общий объем признака мысленно распределяется поровну между всеми единицами совокупности.Средняя арифметическая определяется по формулам:Средней арифметической простой (для несгруппированных данных):,(2.1)где: – значение признака у i-й единицы совокупности; n – объем совокупности (Valid N).Средней арифметической взвешенной (для интервального вариационного ряда):, (2.2)где:fi – абсолютные частоты; xi – середина интервала.Определим среднюю арифметическую для рассматриваемых данных:По формуле простой средней на основе массива несгруппированых данных:По формуле средней арифметической взвешенной на основе группировочной таблицы с 8 интервалами (табл. 2.1):Таблица 2.1 Расчет средней арифметической взвешенной дляраспределения регионов России по количеству легковых автомобилей на 1000 чел. населения за 2012 г.ИнтервалАбсолютная частота (fi)Середина интервала (xi)19,31429-49,68571234,56949,68571-80,05714364,871425194,614380,05714-110,4286695,24287571,4572110,4286-140,815125,61431884,215140,8-171,171432155,98574991,542171,1714-201,542913186,357152422,643201,5429-231,91434216,7286866,9144231,9143-262,28575247,11235,5Итого: 80–12235,89Если при замене индивидуальных величин признака на среднюю величину необходимо сохранить неизменным произведение индивидуальных величин, то следует применить геометрическую среднюю величину. Ее формула такова: (2.3)Значение средней геометрической было рассчитано с помощью ППП «Statistica» и составило 145,9133.При изучении вариации применяются такие характеристики вариационного ряда, которые описывают количественно его структуру, строение. Такова, например, медиана – величина варьирующего признака, делящая совокупность на две равные части – со значениями признака меньше медианы и со значениями признака больше медианы. В интервальном вариационном ряду для нахождения медианы применяется формула:, (2.4)где: Ме – медиана; Хе – нижняя граница интервала, в котором находится медиана; n – число наблюдений; fMe-1 – накопленная частота в интервале, предшествующем медианному; fMe – частота в медианном интервале; i – величина интервала.Рассчитаем значение медианы вариационного ряда, использовав для этого таблицу распределения с 8-ю интервалами (табл. 2.1). Медианным интервалом является интервал 140,8-171,1714, следовательно нижняя граница медианного интервала – 140,8; величина интервала – 30,37 (164,42–171,17); кумулятивная частота предшествующего интервала – 26, частота медианного интервала – 32. Медиана вариационного ряда равна: Значение медианы, рассчитанное с помощью программы Statistica (по исходному несгруппированному ряду данных), составляет 153,45.Важное значение имеет такая величина признака, которая встречается в изучаемом ряду, в совокупности чаще всего. Такую величину принято называть модой и обозначать Мо. В дискретном ряду мода определяется без вычисления как значение признака с наибольшей частотой.В интервальном вариационном ряду, тем более при непрерывной вариации признака, строго говоря, каждое значение признака встречается только один раз. Модальным интервалом является интервал с наибольшей частотой. Значение моды в интервальном ряду распределения определяется по следующей формуле:, (2.5)где:Х0 – нижняя частота модального интервала; fMo – частота в модальном интервале; fMo-1 – частота в предыдущем интервале; fMo+1 – частота в следующем интервале за модальным; i – величина интервала.Модальным интервалом является интервал 140,8-171,17; нижняя граница интервала – 140,8; частота модального интервала – 32, частота предыдущего интервала – 15; частота следующего интервала – 13; величина интервала – 30,37.Определим модальное значение: В ППП Statistica значение моды определяется непосредственно по исходным несгруппированным данным. Для рассматриваемого случая модальное значение равно 161,7, а его частота составляет 2. 3. ОЦЕНКА ВАРИАЦИИ ИЗУЧАЕМОГО ПРИЗНАКА Вариация – это различие в значениях какого-либо признака у разных единиц данной совокупности в один и тот же период или момент времени. Она возникает в результате того, что индивидуальные значения признака складываются под влиянием различных факторов, которые в разном случае могут сочетаться по-разному. К показателям вариации относятся: размах вариации, дисперсия и среднее квадратическое отклонение, коэффициент вариации. Простейшим показателем вариации является размах, или амплитуда вариации, – абсолютная разность между максимальным и минимальным значениями признака из имеющихся в изучаемой совокупности значений. Таким образом, размах вариации вычисляется по формуле:, (3.1)Минимальное значение признака (Xmin) для исследуемой совокупности составило 34,5, а максимальное (Xmax) – 247,1. Следовательно, размах вариации для вариационного ряда составляет:Дисперсия признака представляет собой средний квадрат отклонений вариантов от их средней величины и вычисляется по следующим формулам:Простая дисперсия для несгруппированных данных: (3.2)Взвешенная дисперсия для вариационного ряда: (3.3)Простая дисперсия по несгруппированным данным была рассчитана с помощью программы Statistica и составила 1730,257. Взвешенная дисперсия по сгруппированным данным рассчитана в табл. 3.1Таблица 3.1 Расчет дисперсии для распределения регионов России по количеству легковых автомобилей на 1000 чел. населения за 2012 г.ИнтервалАбсолютная частота (fi)Середина интервала (xi)19,31429-49,68571234,5028060,1349,68571-80,05714364,8723272,7580,05714-110,4286695,2419979,69110,4286-140,815125,6111207,44140,8-171,171432155,99295,17171,1714-201,542913186,3614509,73201,5429-231,91434216,7316271,57231,9143-262,28575247,1044322,46Итого: 80 –157918,93Взвешенная дисперсия вариационного ряда:Среднее квадратическое отклонение – это обобщающая характеристика размеров вариации признака в совокупности. Оно показывает, на сколько в среднем отклоняются конкретные варианты от их среднего значения. Среднее квадратическое отклонение является корню квадратному из дисперсии.Определим среднее квадратическое отклонение:По исходному ряду данных:По сгруппированным данным:Чем меньше значение дисперсии и среднего квадратического отклонения, тем более однородна исследуемая совокупность.Для сравнения вариаций различных признаков используются относительные показатели вариации, в частности, коэффициент вариации. Коэффициент вариации представляет собой выраженное в процентах отношение среднего квадратического отклонения к средней арифметической: (2.8)Коэффициент вариации исследуемого ряда данных равен:Коэффициент вариации используют не только для сравнительной оценки вариации единиц совокупности, но и как характеристику однородности совокупности. Совокупность считается количественно однородной, если коэффициент вариации не превышает 33%.Так как коэффициент вариации в данном случае составляет 27,18%, т.е. значительно меньше 33%, то исследуемая совокупность является количественно однородной. 4. ХАРАКТЕРИСТИКА СТРУКТУРЫ РАСПРЕДЕЛЕНИЯСтруктура распределения характеризуется такими показателями, как медиана, квартили и децили. Медиана ряда распределения была определена в разделе 2, она составила 153,45.Аналогично медиане вычисляются значения признака, делящие совокупность на четыре равные по числу единиц части. Эти величины называются квартилями и обозначаются заглавной латинской буквой Q с подписным значком номера квартиля. Очевидно, что Q2 равно медиане распределения.Значения признака, делящие ряд на пять равных частей, называют квинтилями, на десять частей – децилями, на сто частей – перцентилями.Для расчёта квартилей применяются следующие формулы:для несгруппированных данных:Нижний (первый) квартиль (Lower quartile):, , (4.1)Верхний (третий) квартиль (Upper quartile):, , (4.2)в интервальном вариационном ряду распределения: (4.3) (4.4)где:Q1 и Q3 – нижний и верхний квартили; , – нижние границы квартильных интервалов; h – величина группировочного интервала; – абсолютные частоты квартильных интервалов; – накопленные (кумулятивные) частоты интервалов, предшествующих квартильным.Рассчитаем квартили распределения на основе сгруппированных данных (табл. 4.1).Таблица 4.1 Исходные данные для расчета квартилей распределения регионов России по количеству легковых автомобилей на 1000 чел. населения за 2012 г.ИнтервалАбсолютная частота (fi)Кумулятивная частота (Fi)19,31429-49,685712249,68571-80,057143580,05714-110,4286611110,4286-140,81526140,8-171,17143258171,1714-201,54291371201,5429-231,9143475231,9143-262,2857580Итого: 80 –Нижний квартиль распределения равен:Верхний квартиль распределения:Квартили, рассчитанные с помощью программы Statistica, немного отличаются от тех, что рассчитаны вручную по сгруппированным данным:Нижний квартиль равен 135,85.Верхний квартиль – 172,75.5. ХАРАКТЕРИСТИКА ФОРМЫ РАСПРЕДЕЛЕНИЯДля дальнейшего изучения характера вариации используются средние значения разных степеней отклонений отдельных величин признака от его средней арифметической величины.Эти показатели получили название центральных моментов распределения порядка, соответствующего степени, в которую возводятся отклонения (табл. 5.1), или просто моментов.Таблица 5.1 Формулы для расчета центральных моментов Порядок моментаФормулы для расчетадля несгруппированных данныхдля сгруппированных данныхПервый Второй Третий Четвертый Согласно свойству средней арифметической центральный момент первого порядка равен нулю, второй центральный момент представляет собой дисперсию. Третий центральный момент используется для оценки асимметрии распределения, четвертый – для оценки эксцесса.На основе момента третьего порядка можно построить показатель, характеризующий степень асимметричности распределения: (5.1)Этот показатель называют коэффициентом асимметрии. Он может быть рассчитан как по сгруппированным, так и по несгруппированным данным.С помощью момента четвертого порядка характеризуется свойство рядов распределения, называемое эксцессом. Показатель эксцесса рассчитывается по формуле: (5.2)Исходные данные для расчета асимметрии и эксцесса приведены в табл. 5.2.Таблица 5.2 Расчет ассиметрии и эксцесса для распределения регионов России по количеству легковых автомобилей на 1000 чел. населения за 2012 г.ИнтервалАбсолютная частота (fi)Середина интервала (xi)19,31429-49,68571134,5-3323682,13393685400,949,68571-80,05714358,12-2049797,54180540318,880,05714-110,4286381,74-1152941,9366531323,0110,4286-140,85105,365-306347,118373775,1140,8-171,171414128,99896,482722,7171,1714-201,542928152,61484749,4616194790,2201,5429-231,914314176,231037801,0666190981,2231,9143-262,28576199,8554173022,64392896041,5Итого: 80 –-1136299,061124415353,4Коэффициент ассиметрии по сгруппированным данным:Коэффициент ассиметрии на основе исходного ряда данных был рассчитан с помощью ППП Statistica и составил -0,341.Коэффициент эксцесса на основе сгруппированных данных:Коэффициент эксцесса, рассчитанный для несгруппированных данных, составил 1,075.Сопоставим показатели, рассчитанные вручную по сгруппированным данным, и показатели, полученные с помощью программы Statistica на основе исходного ряда данных (табл. 5.3).Таблица 5.3 Сравнение статистических показателей, рассчитанных различными способами№Название показателяЗначение в ППП StatisticaЗначение после ручного расчетаСредняя арифметическая153,055152,95Медиана153,45154,09Мода161,70155,14Дисперсия1730,2571973,99Нижний квартиль135,85128,65Верхний квартиль172,75175,846. СГЛАЖИВАНИЕ ЭМПИРИЧЕСКОГО РАСПРЕДЕЛЕНИЯ. ПРОВЕРКА ГИПОТЕЗЫ О ЗАКОНЕ РАСПРЕДЕЛЕНИЯОдна из важнейших задач анализа вариационных рядов заключается в выявлении закономерности распределения и определении ее характера. Основной путь в выявлении закономерности распределения – построение вариационных рядов для достаточно больших совокупностей. Важное значение для выявления закономерности распределения имеет правильное построение самого вариационного ряда: выбор числа групп и размера интервала варьирующего признака.Говоря о характере, типе закономерности распределения, имеем в виду отражение в нем общих условий вариации. При этом речь всегда идет о распределениях качественно однородных явлений. Общие условия, определяющие тип закономерности распределения, познаются анализом сущности явления, тех его свойств, которые определяют вариацию изучаемого признака. Следовательно, должна быть выдвинута какая-то научная гипотеза, обосновывающая тип теоретической кривой распределения. Под теоретической кривой распределения понимается графическое изображение ряда в виде непрерывной линии изменения частот в вариационном ряду, функционально связанного с изменением вариантов (значений признака).Теоретическое распределение может быть выражено аналитически – формулой, которая связывает частоты вариационного ряда и соответствующие значения признака. Такие алгебраические формулы носят название законов распределения.Процедура выравнивания, сглаживания анализируемого распределения заключается в замене эмпирических частот теоретическими, определяемыми по формуле теоретического распределения, но с учетом фактических значений переменной. На основе сопоставления эмпирических и теоретических частот рассчитываются критерии согласия, которые используются для проверки гипотезы о соответствии исследуемого распределения тому или иному типу теоретического распределении.Для проверки статистической гипотезы о законе распределения будем использовать критерий – критерий Пирсона (Chi-square test). Расчет критерия производится по следующей формуле: (6.1)где: – эмпирические абсолютные частоты (Observed Frequency); – абсолютные частоты теоретического распределения (Expected Frequency); k – число интервалов.С помощью ППП Statistica проведем сглаживание рассматриваемого распределения и проверим статистическую гипотезу о законе распределения.Рис. 6.1. Проверка гипотезы о нормальном распределении переменной Var1Для сглаживания эмпирического распределения переменной Var1 нормальным распределением необходимо использовать формулы, приведенные ниже.Функция нормального распределения: (6.2)Плотность нормального распределения определяется по формуле: (6.3)где:х – значение изучаемого признака; – средняя арифметическая величина; – среднее квадратическое отклонение изучаемого признака; – математические константы; – нормированное отклонение.Теоретические частоты нормального распределения рассчитываются по следующей формуле: (6.4)где:N – объем совокупности; h – величина интервала.Из рис. 6.1.

Список литературы

СПИСОК ИСПОЛЬЗОВАННОЙ ЛИТЕРАТУРЫ

1. Боровиков В.П., STATISTICA. Искусство анализа данных на компьютере: для профессионалов / В. П. Боровиков. – 2-е изд. – СПб. : – 2003. – 688 с.
2. Венецкий И.Г., Основные математико-статистические понятия и формулы в экономическом анализе. Справочник / И.Г. Венецкий, В.И. Венецкая. – 2-е изд., перераб. и доп. – М. : Статистика, 1979. – 477 с.
3. Гмурнан В.Э. Теория вероятностей и математическая статистика: Учеб. пособие. – М.: Высш. шк., 2003. – 479 с.
4. Гусаров В.М. Статистика: Учеб. пособие для вузов. – М.: ЮНИТИ-ДАНА, 2003. – 463 с.
5. Елисеева И.И., Юзбашев М.М. Общая теория статистики: Учебник / Под ред. И.И. Елисеевой. – 5-е изд., перераб. и доп. – М.: Финансы и статистика, 2004. – 656 с.
6. Закс Л., Статистическое оценивание: Пер. с нем / Л. Закс. – М.: Статистика, 1976. – 597 с.
7. Н.В. Куприенко Статистика. Методы анализа распределений. Выборочное наблюдение. 3-е изд. : учеб. пособие. / Н.В. Куприенко, О.А. Пономарева, Д.В. Тихонов. – СПб.: Изд-во Политехн. ун-та, 2009. – 138 с.
8. Общая теория статистики: Статистическая методология в изучении коммерческой деятельности: Учебник. / Под ред. А.А. Спирина, О.Э. Башиной. – М.: Финансы и статистика, 1996. – 296 с.
9. Общая теория статистики: учеб. / М.Р. Ефимова, Е.В. Петрова, В.Н. Румянцев. – М.: ИНФРА-М, 2002. – 416 с.
10. Орлов А.И. Прикладная статистика. Учебник. / А.И. Орлов. – М.: Издательство «Экзамен», 2004. – 656 с.
11. Регионы России. Социально-экономические показатели. 2006: Стат.сб. М., 2007.
12. Сизова Т.М. Статистика: Учебное пособие. – СПб.: СПб ГУИТМО, 2012. – 80 с.
13. Теория статистики.: учеб. /Под ред. Р.А. Шмойловой. – М.: Финансы и статистика, 2012. – 560 с.
14. Теория статистики: учеб. / Под ред. проф. Г.Л. Громыко. – 2-е изд., перераб. и доп. – М.: ИНФРА-М, 2006. – 476 с.
15. Экономическая статистика: Учебник. / Под ред. Ю.Н. Иванова. – М.: ИНФРА-М, 2004. – 480 с.

Очень похожие работы
Пожалуйста, внимательно изучайте содержание и фрагменты работы. Деньги за приобретённые готовые работы по причине несоответствия данной работы вашим требованиям или её уникальности не возвращаются.
* Категория работы носит оценочный характер в соответствии с качественными и количественными параметрами предоставляемого материала. Данный материал ни целиком, ни любая из его частей не является готовым научным трудом, выпускной квалификационной работой, научным докладом или иной работой, предусмотренной государственной системой научной аттестации или необходимой для прохождения промежуточной или итоговой аттестации. Данный материал представляет собой субъективный результат обработки, структурирования и форматирования собранной его автором информации и предназначен, прежде всего, для использования в качестве источника для самостоятельной подготовки работы указанной тематики.
bmt: 0.00525
© Рефератбанк, 2002 - 2024