Рекомендуемая категория для самостоятельной подготовки:
Курсовая работа*
Код |
326216 |
Дата создания |
08 июля 2013 |
Страниц |
30
|
Мы сможем обработать ваш заказ (!) 18 ноября в 12:00 [мск] Файлы будут доступны для скачивания только после обработки заказа.
|
Содержание
Содержание
Введение
Содержательное описание объекта моделирования
Идентификация законов распределения
Описание программного интерфейса и способов кодирования информации
Результаты модельных расчетов и их интерпретация
Текст программы
Заключение
Список используемой литературы
Введение
Составить прогноз по заболеваемости сердечно-сосудистой системы на 2015 год.
Фрагмент работы для ознакомления
Отсутствие автокорреляции остатков означает, что остаток представляет собой «белый шум», то есть он устроен как нормальное распределение с нулевым средним.
5. Гетероскедастичность — состояние, при котором измерения вариативности являются большими, чем ожидаемые случайно.
6. Мультиколлинеарность (multicollinearity) – положение, при котором одна или более независимых переменных, входящих в уравнение регрессии, являются точными линейными функциями от одной или более других независимых переменных того же уравнения.
Рекурсивность означает такую модель, при которой
,
при этом функция линеализируема.
При изучении тесноты связи между двумя взаимно зависимыми присылками применяется линейный коэффициент корреляции, которым показывает, существует ли и сколь велика связь между этими признаками.
Коэффициент корреляции принимает значения от - 1 до + 1. В этих пределах возможны все числовые значения коэффициента корреляции. Если никакой связи между признаками не существует, то коэффициент ранен 0. При положительной корреляции при увеличении числовых значений одного признака соответственно увеличиваются числовые значения другого признака. При отрицательной корреляции увеличению числовых значений одного признака соответствует уменьшение числовых значений другого признака.
Линейная регрессия — метод восстановления зависимости между двумя переменными. Ниже приведен пример программы, которая строит линейную модель зависимости по заданной выборке и показывает результат на графике.
Для заданного множества из пар , , значений свободной и зависимой переменной требуется построить зависимость. Назначена линейная модель
c аддитивной случайной величиной . Переменные принимают значения на числовой прямой . Предполагается, что случайная величина распределена нормально с нулевым математическим ожиданием и фиксированной дисперсией , которая не зависит от переменных . При таких предположениях параметры регрессионной модели вычисляются с помощью метода наименьших квадратов.
Например, требуется построить зависимость цены нарезного хлеба от времени. (См. рис. далее по тексту). В таблице регрессионной выборки первая колонка — зависимая переменная (цена батона хлеба), вторая — свободная переменная (время). Всего данные содержат 195 пар значений переменных. Данные нормированы.
Определим модель зависимости как
Согласно методу наименьших квадратов, искомый вектор параметров
есть решение нормального уравнения
где — вектор, состоящий из значений зависимой переменной, . Столбцы матрицы есть подстановки значений свободной переменной
и , .
Матрица имеет вид
Зависимая переменная восстанавливается по полученным весам и заданным значениям свободной переменной
иначе
Для оценки качества модели используется критерий суммы квадратов регрессионных остатков, SSE — Sum of Squared Errors.
Пример нахождения параметров модели и восстановления линейной регрессии (код на языке Matlab).
A = [x.^0, x]; % построить матрицу подстановок
% x - (m,1)-вектор, у - (m,1)-вектор
w = (A'*A)\(A'*y); % решить нормальное уравнение
% методом гауссова исключения
w = pinv(A'*A)*(A'*y);% вариант обращения матрицы
y1 = w(1)+w(2)*x; % восстановить зависимую переменную
% при заданных значениях x
r = y-y1; % найти вектор регрессионных остатков
SSE = r'*r % подсчитать ошибку
Для решения задачи, поставленной в курсовой работе будем использовать полиномиальную модель.
Пусть регрессионная модель — полином заданной степени ,
Матрица в случае полиномиальной регрессии называется матрицей Вандермонда и принимает вид
Одномерная регрессия — частный случай полиномиальной регрессии.
Ниже приведен пример нахождения параметров модели и восстановления полиномиальной регрессии на языке Matlab.
% функция для построения матрицы подстановок
f = inline('[x.^0, x, x.^2, x.^3]','x');
A = f(x); % матрица подстановок есть функция
% значений свободной переменой
w = (A'*A)\(A'*y); % решить нормальное уравнение
y2 = A*w; % восстановить зависимую переменную
r = y-y2; % найти вектор регрессионных остатков
SSE = r'*r % подсчитать ошибку
Описание программного интерфейса и способов кодирования информации
Имеются исходные данные
Y =
131.3897 130.0905 128.2487 129.8777 131.9186 130.1857 132.5591 131.5698 132.8337 132.2684
Z =
127.7879 131.7651 132.2499 134.9784 134.5968 125.7789 137.4482 128.6469 122.0039 122.1229
Опишем действие программы.
Совместное распределение двух графиков выглядит следующим образом.
Каждую последовательность будем рассматривать как динамический ряд Y(t).
Будем моделировать данный ряд при помощи полиномиальной регрессии Y(t-t0)=a+b*(t-t0)+c(t-t0)2
Коэффициенты a,b,c находятся при помощи коэффициентов корреляции векторов Y и (t-t0), а также Y и (t-t0)2. Эта техника аналогична нахождению коэффициентов множественной регрессии.
Наша программа нашла эти коэффициенты так.
p_y =
0.0464 -0.2073 130.4476
p_z =
-0.4268 3.8540 124.9727
Отсюда получаем графики для полиномиальной аппроксимации динамических рядов.
Для диабета:
Для ожирения.
Теперь если Y_- аппроксимация кривой Y (диабет), то прогноз вычисляется как
Y_(t-t0)=Y_(2015-1999)=Y_(16);
Теперь если Z_- аппроксимация кривой Z (ожирение), то прогноз вычисляется как
Z_(t-t0)=Z _(2015-1999)=Z _(16);
Наша программа вычислила это как
PROGNOZ_Y =
136.6413
PROGNOZ_Z =
95.2753
Результаты модельных расчетов и их интерпретация
Приведем результаты модельных расчетов.
Прогноз по заболеваемости сердечно-сосудистой системы по причине диабет на 2015 год (на 100 000 населения):
136.64
Прогноз по заболеваемости сердечно-сосудистой системы по причине ожирения на 2015 год (на 100 000 населения):
95.28
Поскольку статистические данные собирались в течение сравнительно небольшого периода (10 лет), а прогноз необходимо составить на 5 лет вперед относительно последнего периода, то можно сделать вывод о незначительности временного промежутка, в течение которого собирались статистические данные относительно удаленности прогнозируемой даты.
Поэтому оценка прогноза не будет достаточно достоверной.
Для более достоверной оценки необходимы статистические данные хотя бы за последние 40 лет.
Текст программы
Программа, реализующая построенную модель, написана
format short;
Y %Y-Заболеваемость сердечно-сосудистой системы причина- Диабет
Z %Y-Заболеваемость сердечно-сосудистой системы причина- Ожирение
figure (65);
hold on;
plot(Y,'k');
plot(Z,'g');
hold off
legend ('Диабет','Ожирение');
x=[1:n];
k=2;
p_y=polyfit(x,Y,k);
regr_Y=get_polynom(p_y,14);
p_z=polyfit(x,Z,k);
regr_Z=get_polynom(p_z,14);
Список литературы
Список используемой литературы
1.Кленин А.Н., Шевченко К.К. Математическая статистика для экономистов-статистиков. - М., 1990. – 278 с.
2.Колемаев В.А., Староверов О.В., Турундаевский В.Б. Теория ве-роятностей и математическая статистика. - М., 1991. – 399 с.
3.Шмойлова Р.А. Теория статистики. - М.: Финансы и Статистика, 1998. – 254 с.
4.Френкель А.А., Адамова Е.В. Корреляционно-регрессионный анализ в экономических приложениях. - М., 1987. – 154 с.
5.Мамонова В.Г. Моделирование систем. – Новосибирск: НГТУ, 2010.
6.http://www.machinelearning.ru/wiki/index.php
7.http://www.demoscope.ru/dem-98/g3.html
Пожалуйста, внимательно изучайте содержание и фрагменты работы. Деньги за приобретённые готовые работы по причине несоответствия данной работы вашим требованиям или её уникальности не возвращаются.
* Категория работы носит оценочный характер в соответствии с качественными и количественными параметрами предоставляемого материала. Данный материал ни целиком, ни любая из его частей не является готовым научным трудом, выпускной квалификационной работой, научным докладом или иной работой, предусмотренной государственной системой научной аттестации или необходимой для прохождения промежуточной или итоговой аттестации. Данный материал представляет собой субъективный результат обработки, структурирования и форматирования собранной его автором информации и предназначен, прежде всего, для использования в качестве источника для самостоятельной подготовки работы указанной тематики.
bmt: 0.00471