Вход

Статистический анализ и обобщение информации

Рекомендуемая категория для самостоятельной подготовки:
Реферат*
Код 227541
Дата создания 12 августа 2016
Страниц 38
Мы сможем обработать ваш заказ (!) 27 апреля в 12:00 [мск]
Файлы будут доступны для скачивания только после обработки заказа.
1 130руб.
КУПИТЬ

Описание

После завершения любого научного исследования, фундаментального или экспериментального, производится статистический анализ полученных данных. Анализ и обобщение информации являются заключительными этапами статистического исследования, конечной целью которого является получение теоретических выводов и практических заключений о тенденциях и закономерностях изучаемых социально-экономических явлений и процессов.
...

Содержание

Введение
1. Статистический анализ
1.1. Классификация данных
1.2. Измерительные шкалы
2. Методы статистического анализа. Выборка
3. Обобщение статистической информации
3.1. Абсолютные величины
3.2. Относительные величины
4. Корреляционная связь и ее анализ
5. Анализ вариации
6. Индексный метод
Практическая часть
Заключение
Список использованной литературы

Введение

Анализ и обобщение статистических данных – это заключительный этап статистического исследования, конечной целью которого является получение теоретических выводов и практических заключений о тенденциях и закономерностях изучаемых социально-экономических явлений и процессов.

Фрагмент работы для ознакомления

Логарифмирование преобразует "скошенные" (ассимметричные) данные в более симметричные, так как происходит "растягивание" шкалы возле нуля, малые значения, сгруппированные вместе, распределяются вдоль шкалы. В то же время логарифмирование собирает вместе большие значения на правом конце шкалы. Наиболее часто применяют десятичные и натуральные логарифмы. Равным расстояниям на логарифмической шкале соответствует на исходной шкале равные процентные увеличения, а не равные увеличения значений.Например, в таблице 2 представлена численность населения (в тыс. чел.) в республиках бывшего СССР в 1976 г:Таблица 2. Численность населения (в тыс. чел.) в республиках бывшего СССР в 1976 г.Теперь заменим все значения десятичными логарифмами. В нижеприведенной таблице вместо численности населения представлены их десятичные логарифмы.Не сложно заметить, что данные симметрично группируются вокруг среднего значения 6,81.2. Методы статистического анализа. ВыборкаПосле того как будет решен вопрос о типе переменной, следует заняться формированием выборки. Выборка - это небольшая группа объектов определенного класса. Для получения абсолютно точных данных нужно исследовать все объекты данного класса, однако, из практических соображений изучают только их часть, которая и называется выборкой. В дальнейшем, статистический анализ позволяет исследователю распространить полученные закономерности на всю выборку с определенной степенью точности. Создание выборки регламентируется рядом обязательных требований, нарушение которых может привести к ошибочным выводам из результатов исследования. Во-первых, важен объем выборки. От объема выборки зависит точность оценки исследуемых параметров. Здесь следует обратить внимание на слово «точность». Чем больше размеры исследуемых групп, тем более точные результаты получает ученый. Для того же, чтобы результаты выборочных исследований можно было переносить на всю выборку в целом, выборка должна быть репрезентативной. Репрезентативность выборки предполагает, что в ней отражены все существенные свойства выборки. Другими словами, в исследуемых группах лица разного пола, возраста, профессий, социального статуса и пр. встречаются с той же частотой, что и во всей выборки.Формировать выборки можно различными путями. Самый простой из них - выбор с помощью генератора случайных чисел необходимого количества объектов из популяции или выборочной рамки (sampling frame). Такой способ называется «простой случайной выборкой». Если случайным образом выбрать начальную точку в выборочной рамке, а затем взять каждый второй, пятый или десятый объекты (в зависимости от того каких размеров группы требуются в исследовании), то получится интервальная выборка. Интервальная выборка не является случайной, так как никогда не исключается вероятность периодических повторений данных в рамках выборочной рамки.Возможен вариант создания так называемой «стратифицированной выборки», которая предполагает, что популяция состоит из нескольких различных групп и эту структуру следует воспроизвести в экспериментальной группе. Например, если соотношение мужчин и женщин 30:70, тогда в стратифицированной выборке их соотношение должно быть таким же. При данном подходе критически важно не балансировать выборку избыточно, то есть избежать однородности ее характеристик, в противном случае исследователь может упустить шанс найти различия или связи в данных.Кроме описанных способов формирования групп есть еще кластерная и квотная выборки. Первая используется в случае, когда получение полной информации о выборочной рамке затруднено из-за ее размеров. Тогда выборка формируется из нескольких групп, входящих в популяцию. Вторая - квотная - аналогична стратифицированной выборке, но здесь распределение объектов не соответствует таковому в популяции.Возвращаясь к объему выборки, следует сказать, что он тесно связан с вероятностью статистических ошибок первого и второго рода. Статистические ошибки могут быть обусловлены тем, что в исследовании изучается не вся популяция, а ее часть. Ошибка первого рода - это ошибочное отклонение нулевой гипотезы. В свою очередь, нулевая гипотеза - это предположение о том, что все изучаемые группы взяты из одной генеральной совокупности, а значит, различия либо связи между ними случайны. Если провести аналогию с диагностическими тестами, то ошибка первого рода представляет собой ложноположительный результат.Ошибка второго рода - это неверное отклонение альтернативной гипотезы, смысл которой заключается в том, что различия либо связи между группами обусловлены не случайным совпадением, а влиянием изучаемых факторов. И снова аналогия с диагностикой: ошибка второго рода - это ложноотрицательный результат. С этой ошибкой связано понятие мощности, которое говорит о том, насколько определенный статистический метод эффективен в данных условиях, о его чувствительности. Мощность вычисляется по формуле: 1-β,где β - это вероятность ошибки второго рода. Данный показатель зависит преимущественно от объема выборки. Чем больше размеры групп, тем меньше вероятность ошибки второго рода и выше мощность статистических критериев. Зависимость эта как минимум квадратичная, то есть уменьшение объема выборка в два раза приведет к падению мощности минимум в четыре раза. Минимально допустимой мощностью считают 80%, а максимально допустимый уровень ошибки первого рода принимают 5%. Однако всегда следует помнить, что эти границы заданы произвольно и могут изменяться в зависимости от характера и целей исследования. Как правило, научным сообществом признается произвольное изменение мощности, однако в подавляющем большинстве случаев уровень ошибки первого рода не может превышать 5%.Обращаясь к самой процедуре анализа, следует указать на два основных типа статистических техник: описательные и доказательные (аналитические). Описательные техники включают в себя методы позволяющие представить данные в компактном и легком для восприятия виде. Сюда можно отнести таблицы, графики, частоты, меры центральной тенденции и меры разброса данных. Другими словами, описательные методы дают характеристику изучаемым выборкам.Наиболее популярный (хотя и зачастую ошибочный) способ описания имеющихся количественных данных заключается в определении следующих показателей:•количество наблюдений в выборке или ее объем;•средняя величина(среднее арифметическое);•стандартное отклонение - показатель того, насколько широко изменяются значения переменных.Важно помнить, что среднее арифметическое и стандартное отклонение - это меры центральной тенденции и разброса в достаточно небольшом числе выборок. В таких выборках значения у большинства объектов с равной вероятностью отклонены от среднего, а их распределение образует симметричный «колокол» (гауссиану или кривую Гаусса-Лапласа). Такое распределение еще называют «нормальным». Если же значения переменной распределены несимметрично относительно центра, то группы лучше описывать с помощью медианы и квантилей (процентилей, квартилей, децилей).Завершив описание групп, необходимо ответить на вопрос об их взаимоотношениях и о возможности обобщить результаты исследования на всю популяцию. Для этого используются доказательные методы. Именно о них в первую очередь вспоминают исследователи, когда идет речь о статистической обработке данных. Обычно этот этап работы называют «тестированием статистических гипотез».Необходимо учитывать, что статистические методы существенно отличаются для качественных и количественных данных.В ситуации, когда изучаемая переменная - качественная и сравниваются только две группы, можно использовать критерий «хи-квадрат». Это достаточно мощный и широко известный критерий, однако, он оказывается недостаточно эффективным в случае, если количество наблюдений мало. Для решения данной проблемы существуют несколько методов, такие как поправка Йейтса на непрерывность и точный метод Фишера.Если изучаемая переменная является количественной, то можно использовать один из двух видов статистических критериев. Критерии первого вида основаны на конкретном типе распределения генеральной совокупности и оперируют параметрами этой совокупности. Такие критерии называют «параметрическими», и они, как правило, базируются на предположении о нормальности распределения значений. Непараметрические критерии не базируются на предположении о типе распределения генеральной совокупности и не используют ее параметры. Иногда такие критерии называют «свободными от распределения» (distribution-free tests). В определенной степени это ошибочно, поскольку любой непараметрический критерий предусматривает, что распределения во всех сравниваемых группах будут одинаковыми, иначе могут быть получены ложноположительные результаты.Существует два параметрических критерия применяемых к данным, извлеченным из нормально распределенной совокупности: t-тест Стьюдента для сравнения двух групп и F-тест Фишера, позволяющий проверить равенство дисперсий (он же - дисперсионный анализ). Непараметрических же критериев значительно больше. Разные критерии отличаются друг от друга по допущениям, на которых они основаны, по сложности вычислений, по статистической мощности и т. д. Однако наиболее приемлемыми в большинстве случаев считаются критерий Вилкоксона (для связанных групп) и критерий Манна-Уитни, также известный как критерий Вилкоксона для независимых выборок. Эти тесты удобны тем, что не требуют предположения о характере распределения данных. Но если окажется, что выборки взяты из нормально распределенной генеральной совокупности, то их статистическая мощность будет несущественно отличаться от таковой для теста Стьюдента.Однако, для более полного понимания вопроса точности статистического анализа необходимо определить и разобрать понятие «доверительной вероятности». Доверительная вероятность - это величина, принятая в качестве границы между вероятными и маловероятными событиями. Максимально допустимой доверительной вероятностью считается величина 0,05. Следует помнить, что доверительная вероятность - это не вероятность некоторого события, а вопрос доверия. Выставляя перед началом анализа доверительную вероятность, мы тем самым определяем степень доверия к результатам наших исследований. А, как известно, чрезмерная доверчивость и излишняя подозрительность одинаково негативно сказываются на результатах любой работы.Уровень доверительной вероятности показывает, какую максимальную вероятность возникновения ошибки первого рода исследователь считает допустимой. Уменьшение уровня доверительной вероятности, иначе говоря, ужесточение условий тестирования гипотез, увеличивает вероятность ошибок второго рода. Следовательно, выбор уровня доверительной вероятности должен осуществляться с учетом возможного ущерба от возникновения ошибок первого и второго рода. 3. Обобщение статистической информацииНа этой стадии проводится анализ статистической информации на основе применения обобщающих статистических показателей. Обобщающие статистические показатели отражают количественную сторону изучаемой совокупности общественных явлений и представляют собой их величину, выраженную соответствующими единицами измерения. Эти статистические величины характеризуют объемы изучаемых процессов, т. е. численность работников, объем товарооборота и др.; их уровни (например, уровень производительности труда); соотношение (например, между продавцами и другими категориями работников) и др. К обобщающим статистическим показателям относят абсолютные и относительные величины. Абсолютные величиныАбсолютными статистическими величинами называются показатели, выражающие размеры (объемы, уровни) конкретных общественных явлений в единицах меры веса, площади, объема, силы, стоимости и пр. Они всегда представляют собой именованные числа, имеющие свою размерность и единицы измерения. Во всех случаях выделяют натуральные, стоимостные и трудовые единицы измерения.Натуральными называют единицы измерения, выражающие величину в физических мерах длины, площади, объема, веса и др. Этими единицами пользуются для характеристики объема производства той или иной продукции, продажи товаров, потребления населением различных продуктов питания, учета надоя молока в сельском хозяйстве и др. В ряде случаев в качестве единиц измерения используются единицы счета времени. В них определяется, например, срок службы сооружения или какого-либо изделия, продолжительность горения лампочки (в часах), средняя продолжительность жизни человека (в годах) и др. Трудовые единицы измерения – человеко-часы, человеко-дни и др. – применяются для определения затрат труда на производство продукции, выполнение работы, для характеристики трудовых ресурсов и их использования.Широкое применение в статистике имеют денежные (стоимостные) единицы измерения – рубль, доллар, экю, евро. Они применяются для характеристики выражения объема продукции, наличия имущества, величины заработной платы и во многих других случаях при оценке в стоимостном (денежном) выражении.Рассмотрим виды абсолютных величин. Абсолютные статистические величины подразделяются на индивидуальные и общие, т. е. итоговые. Индивидуальные абсолютные величины выражают показатели, или размеры, качественных признаков у отдельных единиц изучаемой совокупности. Они имеют большое значение в статистическом исследовании и регистрируются в формулярах наблюдения. Относительные величиныВ статистике относительными величинами называются частные от деления двух статистических величин. Они характеризуют количественное соотношение между этими величинами. Относительные величины в экономических исследованиях необходимы постольку, поскольку практическая статистика не может ограничиться исчислением только абсолютных величин.При расчете относительных величин следует в числитель отношения помещать показатель, отражающий то явление, которое изучается, т. е. сравниваемый показатель, а в знаменатель – показатель, с которым производится сравнение. Последний показатель принимается за основание (базу) сравнения. База сравнения выступает здесь в качестве своеобразного измерителя. В зависимости от того, какое числовое значение имеет база сравнения, результат отношения может быть выражен коэффициентом или процентом, а также в форме промилле и децимилле. При применении базы сравнения, принятой за единицу, относительная величина (результат сравнения) является коэффициентом. Он показывает, во сколько раз изучаемая величина больше основания. Если же принять основание за 100 %, результат вычисления относительной величины будет выражен также в процентах. Он применяется в случаях, если эта сравниваемая величина существенно больше той, с которой производится сравнение.При базе сравнения 1000 (часто при исчислении демографических коэффициентов) результат сравнения выражается в промилле (‰). Наконец, при основании отношения, равном 10000, относительная величина выражается в децимилле. В каждом отдельном случае следует выбирать такую форму выражения величин, которая будет воспринята более легко и наглядно. Например, лучше сказать, что действующие нормы времени завышены по сравнению с технически обоснованными нормами в 2 раза, чем отметить, что степень завышения этих норм составляет 200%.По своему познавательному значению относительные величины подразделяются на следующие виды: выполнения договорных обязательств, структуры, динамики, сравнения, координации и интенсивности.Вследствие перехода экономики страны на рыночные отношения из статистической отчетности выпадают многие плановые показатели. Например, в анализе не будет относительных величин выполнения плана – отношения уровня, запланированного на предстоящий период, к уровню показателя, достигнутого в предыдущем периоде; относительного показателя выполнения плана – отношения фактически достигнутого уровня в текущем периоде к уровню планируемого показателя за тот же период. Вместо них исчисляются другие величины:1) договорные обязательства – это показатель, характеризующий уровень выполнения предприятием своих обязательств, предусмотренных договорами;2) относительные величины структуры, характеризующие состав изучаемых совокупностей. Они исчисляются как отношение абсолютной величины каждого из элементов совокупности к абсолютной величине этой совокупности, представляя тем самым удельный вес части в целом. Эти величины выражаются, как правило, в процентах;3) относительные величины динамики, характеризующие изменение изучаемого явления во времени, определяющие направления развития, интенсивность развития какого-либо явления во времени. Их расчет выполняется в виде роста и других показателей динамики. Они могут быть выражены в коэффициентах или процентах и определяются с применением переменной (цепные) и постоянной (базисные) базы сравнения;4) относительные величины сравнения, характеризующие количественные соотношения одноименных показателей, относящихся к различным объектам статистического наблюдения;5) относительные величины координации, представляющие собой одну из разновидностей показателей сравнения. Применяются для характеристики соотношения меду отдельными частями статистической совокупности и показывают, во сколько раз сравниваемая часть больше или меньше части, которая применяется в качестве основания, базы сравнения;6) относительные величины интенсивности, показывающие, насколько широко распространено изучаемое явление в той или иной среде, характеризуют соотношение разноименных, но связанных между собой абсолютных величин. В отличие от других видов относительных величин данные величины являются именованными показателями и могут выражаться в кратных отношениях, процентах, промилле и других формах.Одним из условий правильного использования статистических показателей является изучение абсолютных и относительных величин в их единстве. Если данное условие не выполняется, возможно получение неправильного вывода. Изучение абсолютных и относительных величин в комплексе позволяет всесторонне охарактеризовать изучаемое явление.Корреляционная связь и ее анализВажнейшей целью статистики является изучение объективно существующих связей между явлениями. В ходе статистического исследования этих связей необходимо выявить причинно-следственные зависимости между показателями, т.е. насколько изменение одних показателей зависит от изменения других показателей.Существует две категории зависимостей (функциональная и корреляционная) и две группы признаков (признаки-факторы и результативные признаки). В отличие от функциональной связи, где существует полное соответствие между факторными и результативными признаками, в корреляционной связи отсутствует это полное соответствие.Корреляционная связь - это связь, где воздействие отдельных факторов проявляется только как тенденция (в среднем) при массовом наблюдении фактических данных. Примерами корреляционной зависимости могут быть зависимости между размерами активов банка и суммой прибыли банка, ростом производительности труда и стажем работы сотрудников.Наиболее простым вариантом корреляционной зависимости является Корреляция парная корреляция, т.е. зависимость между двумя признаками (результативным и факторным или между двумя факторными). Математически эту зависимость можно выразить как зависимость результативного показателя у от факторного показателя х. Связи могут быть прямые и обратные. В первом случае с увеличением признака х увеличивается и признак у, при обратной связи с увеличением признака х уменьшается признак у.Важнейшей задачей является определение формы связи с последующим расчетом параметров уравнения, или, иначе, нахождение уравнения связи (Уравнение регрессии).

Список литературы

1. Чернова Т.В. Экономическая статистика. Учебное пособие. - Таганрог: Изд-во ТРТУ, 2009. - 376 с.
2. Гусаров В.М. Общая теория статистики - Учебное пособие для студентов вузов, обучающихся по экономическим специальностям - Москва: ЮНИТИ-ДАНА, 2012.- 207 с.
3. Елисеева И.И., Юзбашев М.М. Общая теория статистики - М.: Финансы и статистика, 2005. - 368 с.
4. Джессен Р. Методы статистических обследований. Пер. с англ. Ю.П. Лукашина, Я.Ш. Паппэ; Под ред. Е.М. Четыркина. - М.: Финансы и статистика, 1995. - 446 с.
5. Виноградова Н.М., Евдокимов В.Т., Хитарова Е.М., Яковлева Н.И. Общая теория статистики. - М.: Статистика, 1998. - 312 с.
6. Баканов М.И., Шеремет А.Д. Теория экономического анализа: Учебник. - 4-е изд., доп. и перераб. - М.: Финансы и статистика, 2012. - 416с.
7. Социально-экономическая статистика / под ред. проф. Б.И.Башкатова. - М.: Юнити, 2010. - 703с.
8. Статистический словарь / Гл. ред. М.А. Королев. - 2-е изд., перераб., и доп. - М.: Финансы и статистика, 1989. - С. 166.
Очень похожие работы
Пожалуйста, внимательно изучайте содержание и фрагменты работы. Деньги за приобретённые готовые работы по причине несоответствия данной работы вашим требованиям или её уникальности не возвращаются.
* Категория работы носит оценочный характер в соответствии с качественными и количественными параметрами предоставляемого материала. Данный материал ни целиком, ни любая из его частей не является готовым научным трудом, выпускной квалификационной работой, научным докладом или иной работой, предусмотренной государственной системой научной аттестации или необходимой для прохождения промежуточной или итоговой аттестации. Данный материал представляет собой субъективный результат обработки, структурирования и форматирования собранной его автором информации и предназначен, прежде всего, для использования в качестве источника для самостоятельной подготовки работы указанной тематики.
bmt: 0.00465
© Рефератбанк, 2002 - 2024