Вход

Анализ эмпирического распределения. Проверка гипотезы о законе распределения Расчетная работа

Рекомендуемая категория для самостоятельной подготовки:
Контрольная работа*
Код 234592
Дата создания 05 июня 2016
Страниц 31
Мы сможем обработать ваш заказ (!) 22 апреля в 12:00 [мск]
Файлы будут доступны для скачивания только после обработки заказа.
950руб.
КУПИТЬ

Описание

Федеральное государственное автономное
образовательное учреждение высшего образования
Санкт-Петербургский политехнический университет Петра Великого

Вариационный ряд – ранжированный в порядке возрастания или убывания ряд вариантов с соответствующими им весами (частотой, частостью). То есть вариационный ряд – двойной числовой ряд, показывающий, каким образом численные значения изучаемого признака связаны с их повторяемостью в выборке.
Прежде чем приступить к вычислению специальных статистических показателей, необходимо из исходной совокупности исключить единицы, не подчиняющиеся общей закономерности распределения, так называемые выбросы. Выбросы – это значения признака, резко отличающиеся как в большую, так и в меньшую сторону, от значений признака у основной части единиц совокупности. Д ...

Содержание

Введение 3
1. Исходные данные 4
2. Расчет основных статистических показателей 10
2.1. Показатели центра распределения 10
2.2. Показатели структуры распределения 14
2.3. Показатели вариации 15
2.4. Относительные показатели вариации 18
2.5. Показатели формы распределения 19
3. Графическое представление данных 24
4. Сглаживание эмпирического распределения 26
4.1. Построение оптимальной группировки 26
4.2. Проверка гипотезы о соответствии распределения регионов РФ по величине общей площади жилых помещений, приходящейся в среднем на одного жителя. Расчет критерия согласия 29
Заключение 31

Введение

Статистические ряды распределения являются одним из наиболее важных элементов статистики. Они представляют собой составную часть метода статистических сводок и группировок, но, по сути, ни одно из статистических исследований невозможно произвести, не представив первоначально полученную в результате статистического наблюдения информацию в виде статистических рядов распределения.
Первичные данные обрабатываются в целях получения обобщенных характеристик изучаемого явления по роду существенных признаков для дальнейшего осуществления анализа и прогнозирования; производится сводка и группировка; статистические данные оформляются с помощью рядов распределения в таблицы, в результате чего информация представляется в наглядном рационально изложенном виде, удобном для использования и дальнейшего ис следования; строятся различного рода графики для наиболее наглядного восприятия и анализ информации. На основе статистических рядов распределения вычисляются основные величины статистических исследований: индексы, коэффициенты; абсолютные, относительные, средние величины и т.д., с помощью которых можно проводить прогнозирование, как конечный итог статистических исследований.
Результаты сводки и группировки материалов статистического наблюдения оформляются в виде статистических рядов распределения. Статистические ряды распределения представляют собой упорядоченное распределение единиц изучаемой совокупности на группы по группировочному (варьирующему) признаку. Они характеризуют состав (структуру) изучаемого явления, позволяют судить об однородности совокупности, границах ее изменения, закономерностях развития наблюдаемого объекта.
Исходными данными к данной расчетной работе являются официальные статистические данные о распределении регионов России по показателю «Общая площадь жилых помещений, приходящаяся в среднем на одного жителя».

Фрагмент работы для ознакомления

Однако приближенно число интервалов k можно оценить исходя только из объема выборки n. Чаще всего это делается с помощью формулы Стерджеса:k=1+3,322lg⁡(n), где n – объем всей выборки.В таблице 2 представлен первый вариант группировки.Таблица 2 – Первый вариант группировкиГруппы регионов по величине жилой площади (м2/чел)Число регионов9,311,49111,4913,68113,6815,87515,8718,063518,0620,252820,2522,44722,4424,62В таблице 3 представлен второй вариант группировки, полученный путем округления размаха вариации.Таблица 3 – Второй вариант группировкиГруппы регионов по величине жилой площади (м2/чел)Число регионов4707101101311316716194719222122252расчет основных статистических показателей2.1. Показатели центра распределенияРезультаты группировки дополним следующими характеристиками: - нижняя граница интервала;- середина интервала;- верхняя граница интервала;- абсолютная частота;- относительная частота;- накопленная частота.Границы интервалов рассчитываются следующим образом:1. Для первого интервала:2. Для последующих интервалов:xнi+1= xвixвi+1= xнi+1+hгде i = 2 … kОчевидно, что:xвk= xmaxНижняя граница первого интервала равна 4. Верхняя граница первого интервала равна 7. Нижняя граница второго интервала совпадает с верхней границей первого и равна 7. Верхняя граница второго интервала равна 10. Для всех последующих групп расчеты ведутся аналогично.Особенностью построения интервальных рядов является предположение об отсутствии вариации признака в пределах группы или интервала (равномерное или прямоугольное распределение). Поэтому в качестве оценки признака в группе используется середина интервала:xi= xнi+ xвi2Абсолютные частоты – это значения в столбце «Число регионов». Относительные частоты или частости (W) – пример показателя структуры. Они определяют удельный вес единиц данной группы в составе совокупности. Как правило, выражаются в процентах. Накопленные частоты рассчитываются по формулам:S1= f1Si= fi+ Si-1Sk= i=1kfiS1= 0S2= 0+1=1S3= 1+1=2 и т.д.Таким образом, дополненные результаты группировки представлены в таблице 4.Таблица 4 – Дополненные результаты группировки№ п/пГруппы регионов по величине жилой площади (м2/чел)Число регионовСередина интервалаWS14705,50,00%0271018,51,27%131013111,51,27%241316714,58,86%9516194717,559,49%56619222120,526,58%7772225223,52,53%79Итого:79-100%Первая группа показателей – показатели центра распределения: средняя, мода и медиана. Средняя рассчитывается по формуле средневзвешенной через абсолютные или относительные частоты:x= i=1kxi×fii=1kfiилиx= i=1kxi×wiРасчет средней арифметической представлен на рисунке 1.Рисунок 1 – Расчет средней арифметической.x=5,5×0+8,5×1+11,5×1+14,5×7+17,5×47+20,5×21+23,5×2 79=17,99 То есть средняя общая площадь жилых помещений, приходящаяся в среднем на одного жителя в 79 регионах РФ равна 17,99 м2.Модальное значение признака рассчитывается по формуле:Mo= xн+h × fMo- fMo-12fMo- fMo-1- fMo+1,где xн – нижняя граница модального интервала; fMo – абсолютная частота признака в модальном интервале; fMo-1 – абсолютная частота признака в интервале, предшествующего модальному; fMo+1 – абсолютная частота признака в интервале, следующего за модальным; h – величина интервала изменения признака в группах.Первое что нужно определить, это интервал с наиболее часто повторяющимся значением (с максимальной абсолютной или относительной частотой). В данном случае это пятый интервал.Расчет моды представлен на рисунке 2.Рисунок 2 – Расчет моды.Mo=16+3×(47-72×47-7-21)= 17,82То есть самая распространенная общая площадь жилых помещений, приходящаяся в среднем на одного жителя в 79 регионах РФ равна 17,82 м2.Медиана рассчитывается по формуле:Me= xн+h × i=1kfi2- SMe-1fMe,где xн – нижняя граница медианного интервала; h – длина интервала; SMe-1 – накопленная частота интервала, предшествующего медианному; fMe – абсолютная частота медианного интервала.Первоначально нужно определить интервал, в котором накапливается не менее половины всей совокупности, то есть:Si≥ 12i=1kfiПоловина совокупности равна 39,5 (79/2). Очевидно, что медианный интервал пятый.Расчет медианы представлен на рисунке 3.Рисунок 3 – Расчет медианы.Me= 16+3× 39,5- 947 = 17,95То есть в 79 регионах РФ величина общей площади жилых помещений, приходящаяся в среднем на одного жителя не превышала 17,95 м2.2.2. Показатели структуры распределенияНижний (первый) квартиль рассчитывается по формуле:Q1= xн+h × i=1kfi4- SQ1-1fQ1,где xн – нижняя граница квартильного интервала; h – длина интервала; SQ1-1 – накопленная частота интервала, предшествующего квартильному; fQ1 – абсолютная частота квартильного интервала.Первоначально нужно определить интервал, в котором накапливается не менее четверти всей совокупности, то есть:Si≥ 14i=1kfi,Аналогично рассчитывается верхний (третий) квартиль по формуле:Q3= xн+h × 3i=1kfi4- SQ3-1fQ3Первый квартиль находится в пятом интервале, а третий квартиль – в шестом: 1/4 от 79 = 19,753/4 от 79 = 59,25Расчет верхнего и нижнего квартиля представлен на рисунке 4.Рисунок 4 – Расчет верхнего и нижнего квартиля.Q1= 16+3 × 794- 947 = 16,69Q3= 19+3 × 3×794-56 21 = 19,462.3. Показатели вариацииНаиболее простым является расчет показателя размаха вариации R как разницы между максимальным (xmax) и минимальным (xmin) наблюдаемыми значениями признака:R= xmax- xminR = 25-4 = 21То есть в 79 регионах РФ общая площадь жилых помещений, приходящаяся в среднем на одного жителя, варьируется в пределах от 4 до 25.Однако размах вариации показывает лишь крайние значения признака. Повторяемость промежуточных значений здесь не учитывается. Точнее характеризует вариацию признака показатель, основанный на учете колеблемости всех значений признака. Поскольку средняя арифметическая является обобщающей характеристикой свойств совокупности, большинство показателей вариации основано на рассмотрении отклонений значений отдельных единиц признака от средней величины. Простейший показатель такого типа – среднее линейное отклонение или среднее абсолютное отклонение как среднее арифметическое значение абсолютных отклонений признака от его среднего уровня:l= i=1kxi- x × fiikfiилиl= i=1kxi- x×fiДля расчета среднего линейного отклонения используется функция =ABS(). Расчет представлен на рисунке 5.Рисунок 5 – Расчет среднего линейного отклонения.l=5,5- 17,99×0+8,5- 17,99×1+11,5- 17,99×1+14,5- 17,99×7+17,5- 17,99×47++20,5- 17,99×21+23,5- 17,99×279 = 1,61Дисперсия для сгруппированных данных рассчитывается по формуле:σ2= i=1kxi- x2×fii=1kfiилиσ2= i=1kxi- x2×wiРасчет дисперсии представлен на рисунке 6.Рисунок 6 – Расчет дисперсии.σ2=5,5- 17,992×0+8,5- 17,992×1+11,5- 17,992×1+14,5- 17,992×7++17,5- 17,992×47+20,5- 17,992×21+23,5- 17,992×279 = 5,34Среднее квадратическое отклонение представляет собой квадратный корень из дисперсии и показывает, на сколько в среднем колеблется величина признака у единиц исследуемой совокупности:σ= i=1kxi- x2×fii=1kfiσ= 5,34=2,312.4. Относительные показатели вариацииДля характеристики меры колеблемости изучаемого признака исчисляются показатели колеблемости в относительных величинах. Они позволяют сравнивать характер рассеивания в различных распределениях (различные единицы наблюдения одного и того же признака в двух совокупностях, при различных значениях средних, при сравнении разноименных совокупностей). Расчет показателей меры относительного рассеивания осуществляют как отношение абсолютного показателя рассеивания к средней арифметической, умножаемое на 100%.К относительным показателям вариации относятся:1. Коэффициент осциляции:VR= Rx ×100%2. Относительное линейное отклонение:Vl= lx ×100%3. Коэффициент вариации:V= σx ×100%4. Коэффициент квартильной вариации:VQ= Q3- Q12MeРасчет относительных показателей представлен на рисунке 7.Рисунок 7 – Расчет относительных показателей вариации.VR=2117,99 ×100%=116,71%Vl=1,6117,99 ×100%=8,95%V=2,3117,99 ×100%=12,84%VQ=19,46-16,692×17,95=7,74%2.5. Показатели формы распределенияКоэффициент ассиметрии Пирсона:AsП= x-MoσВеличина показателя асимметрии может быть как положительной, так и отрицательной. Если As>0, то это означает, что большая часть совокупности сконцентрирована слева от средней (правосторонняя асимметрия). Если же As<0, то это означает, что большая часть совокупности сконцентрирована справа от средней (левосторонняя асимметрия). Наиболее точным и распространенным является показатель, основанный на определении центрального момента третьего порядка:As= m3σ3Для симметричных распределений рассчитывается показатель эксцесса (островершинности) распределения.Наиболее точным является показатель, основанный на использовании центрального момента четвертого порядка:Ex= m4σ4-3Эксцесс представляет собой выпад вершины эмпирического распределения вверх или вниз от вершины кривой нормального распределения. В нормальном распределении значение Ex = 3. Поэтому в соответствии с соотношением значение показателя эксцесса может быть как положительным (островершинное распределение), так и отрицательным (плосковершинное распределение). Коэффициент эксцесса также является характеристикой вариации признака совокупности. Например, дисперсия островершинного распределения меньше, чем у плосковершинного. Моментом распределения называется средняя арифметическая тех или иных степеней отклонений индивидуальных значений признака от определенной исходной величины. Рассчитывается по формуле:mα= i=1kxi-Aα×fii=1kfiгде А – величина, от которой определяются отклонения, α – степень отклонения (порядок момента). В зависимости от того, что принимается за величину А, различают три вида моментов:1. Начальные моменты Мα получают при А = 0.2. Центральные моменты μα получают при А = x.3. Условные моменты mα получают при А, не равной средней арифметической и отличной от нуля.Расчет 3-го центрального момента представлен на рисунке 8.Рисунок 8 – Расчет 3-го центрального момента.m3=5,5- 17,993×0+8,5- 17,993×1+11,5- 17,993×1+14,5- 17,993×7++17,5- 17,993×47+20,5- 17,993×21+23,5- 17,993×279 = -9,74Расчет 4-го центрального момента представлен на рисунке 9.Рисунок 9 – Расчет 4-го центрального момента.

Список литературы

В данной работе были произведены расчеты основных статистических характеристик распределении регионов РФ по показателю «Общая площадь жилых помещений, приходящаяся в среднем на одного жителя».
Так же были посчитаны расчетное и теоретическое значения критерия Пирсона, и была проведена проверка гипотезы о соответствии распределения регионов РФ по величине общей площади жилых помещений, приходящейся в среднем на одного жителя, нормальному закону.
Очень похожие работы
Пожалуйста, внимательно изучайте содержание и фрагменты работы. Деньги за приобретённые готовые работы по причине несоответствия данной работы вашим требованиям или её уникальности не возвращаются.
* Категория работы носит оценочный характер в соответствии с качественными и количественными параметрами предоставляемого материала. Данный материал ни целиком, ни любая из его частей не является готовым научным трудом, выпускной квалификационной работой, научным докладом или иной работой, предусмотренной государственной системой научной аттестации или необходимой для прохождения промежуточной или итоговой аттестации. Данный материал представляет собой субъективный результат обработки, структурирования и форматирования собранной его автором информации и предназначен, прежде всего, для использования в качестве источника для самостоятельной подготовки работы указанной тематики.
bmt: 0.00508
© Рефератбанк, 2002 - 2024