Вход

Разработка приложения для кредитного скоринга

Рекомендуемая категория для самостоятельной подготовки:
Дипломная работа*
Код 517003
Дата создания 2020
Мы сможем обработать ваш заказ (!) 2 мая в 12:00 [мск]
Файлы будут доступны для скачивания только после обработки заказа.
1 600руб.
КУПИТЬ

Описание

Большие данные – современное технологическое направление, связанное с обработкой крупных массивов данных, которые постоянно растут. Оно широко развивается в эпоху информационных технологий, которые ориентированы на сохранение и обработку информации.

Финансовая отрасль как собственник больших объёмов данных активно пользуется современными технологиями в целях оптимизации затрат, грамотного управления рисками, борьбы с мошенничеством, а также расчёта премий и бонусов для сотрудников. Одной таких областей использования технологий является кредитный скоринг.

Кредитный скоринг - это математическая или статистическая модель, с помощью которой на основе кредитной истории банк пытается определить, насколько велика вероятность, что конкретный потенциальный заемщик вернет кредит в срок.

В самом упрощенном виде скоринговая модель представляет собой взвешенную сумму определенных характеристик. В результате получается интегральный показатель (score); чем он выше, тем выше надежность клиента, и банк может упорядочить своих клиентов по степени возрастания кредитоспособности .

В кредитном скоринге существуют такие понятия как «характеристики» и «признаки». Характеристиками считаются переменными, а признаки- это значение, которые принимают характеристики.

Сложность заключается в определении, какие характеристики следует включать в модель и какие весовые коэффициенты должны им соответствовать, поскольку банк располагает огромным числом признаков, которые могут быть использованы с целью определения благонадёжности клиента.

В данной выпускной квалификационной работе рассматривается оценивание благонадёжности заёмщика по сокращённому списку ключевых характеристик, которые далее упоминаются как оптимальный набор признаков. Предполагаемой гипотезой является способность моделей делать более точные предсказания при использовании сокращённого списка ключевых характеристик. Гипотеза рассматривалась на различных методах решения задачи классификации.

Целью выпускной квалификационной работы является анализ темы и разработка приложения – инструмента для кредитного скоринга, позволяющего сравнивать различные методы по показателям, определять оптимальный набор признаков на определённых данных и на основе полученных данных реализовывать кредитный скоринг с сокращённым числом вводимых данных.

Выпуская работа содержит:

1) Введение

2) Первая глава. В данной главе описываются методы решения задачи кредитного скоринга, поясняются метрики машинного обучения для задачи кредитного скоринга и поясняется определение ROC-кривых

3) Вторая глава. В данной главе описывается и реализуется задача кредитного скоринга с помощью различных классификаторов и задача поиска оптимального набора признаков для определённых классификаторов

4) Третья глава. В данной главе описываются полученные результаты и созданное приложение.

5) Заключение

6) Приложение

Содержание

ВВЕДЕНИЕ..................................................................................................... 4

Основная часть................................................................................................ 6

1 Теория.......................................................................................................... 6

1.1 Описание задачи скоринга….................................................................... 6

1.2 Виды методов решения задачи скоринга................................................. 7

1.2.1 Статистические методы.......................................................................... 7

1.2.2 Деревья решений.................................................................................... 8

1.2.3 Нейронные сети...................................................................................... 8

1.2.4 Метод опорных векторов....................................................................... 8

1.2.5 TextMining.............................................................................................. 8

1.3 Описание методов, рассмотренных в дипломной работе....................... 9

1.3.1 Метод логистической регрессии.......................................................... 9

1.3.2 Наивный Байесовский классификатор................................................. 11

1.3.3 Метод ближайших соседей.................................................................. 11

1.3.4 Метод построения случайного леса.................................................... 11

1.3.5 Метод построения дерева решения..................................................... 12

1.4 ROC-анализ и метрики машинного обучения....................................... 14

2 Практическая часть................................................................................... 17

2.1 Сравнение показателей различных классификаторов.......................... 17

2.2 Сравнение метрик моделей с различным количеством признаков...... 20

2.3. Разработка приложения........................................................................ 24

2.3.1. Вкладка Работа с моделью предсказания........................................... 28

2.3.2. Вкладка Поиск оптимального количество признаков........................ 32

2.3.3. Вкладка Персональный скоринг......................................................... 38

ЗАКЛЮЧЕНИЕ............................................................................................ 42

СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ…................................. 43

ПРИЛОЖЕНИЕ А….................................................................................... 45

ПРИЛОЖЕНИЕ Б......................................................................................... 46

ПРИЛОЖЕНИЕ В…..................................................................................... 47

ПРИЛОЖЕНИЕ Г…..................................................................................... 54

Список литературы

1 Применение логистической регрессии в медицине и скоринге [Электронный ресурс]. – Режим доступа:, cвободный (дата обращения 15.04.2020).

2 Алгоритмы классификации–Наивный Байес [Электронный ресурс].

–Режим доступа: https://coderlessons.com/tutorials/python- technologies/logisticheskaia-regressiia-v-python/logisticheskaia-regressiia- v-python-kratkoe-rukovodstvo , свободный (дата обращения 27.04.2020)

3 Введение в машинное обучение [Электронный ресурс]. – Режим доступа: https://habr.com/ru/company/mlclass/blog/247751/ , свободный (дата обращения 28.04.2020)

4 Scikit-learn: Machine Learning in Python [Электронный ресурс]. – Режим доступа: https://scikit-learn.org/stable/index.html, свободный (дата обращения 28.04.2020)

5 Логистическая регрессия в Python – Краткое руководство [Электронный ресурс]. – Режим доступа: https://coderlessons.com/tutorials/python- technologies/logisticheskaia-regressiia-v-python/logisticheskaia-regressiia-

v-python-kratkoe-rukovodstvo, свободный (дата обращения 30.04.2020)

6 Метрики в задачах машинного обучения [Электронный ресурс]. – Режим доступа: https://habr.com/ru/company/ods/blog/328372/, свободный (дата обращения 30.04.2020)

7 Магические команды matplotlib [Электронный ресурс]. – Режим доступа: https://pyprog.pro/mpl/mpl_magic_teams.html, свободный (дата обращения 30.04.2020)

8 Recursive Feature Elimination (RFE) for Feature Selection in Python [Электронный ресурс]. – Режим доступа : https://machinelearningmastery.com/rfe-feature-selection-in-python/, свободный (дата обращения 06.05.2020)


9 Python and Qt : simplified! [Электронный ресурс]. –Режим доступа:, свободный (дата обращения 08.05.2020)

10 Кочеткова, В.В. Обзор методов кредитного скоринга / В.В. Кочеткова, К.Д Ефревама Национальный исследовательский университет «Высшая школа экономики» г.Москва //Juvenis Scientia|Экономические науки. ,- 2017.№ 6.-C.22-25.

11 Андреева, Г.В. Скоринг как метод оценки кредитного риска ресурс/Г.В.Андреева //Банковские технологии. ,-2010.-№ 14(98).-С.35- 49.

Очень похожие работы
Пожалуйста, внимательно изучайте содержание и фрагменты работы. Деньги за приобретённые готовые работы по причине несоответствия данной работы вашим требованиям или её уникальности не возвращаются.
* Категория работы носит оценочный характер в соответствии с качественными и количественными параметрами предоставляемого материала. Данный материал ни целиком, ни любая из его частей не является готовым научным трудом, выпускной квалификационной работой, научным докладом или иной работой, предусмотренной государственной системой научной аттестации или необходимой для прохождения промежуточной или итоговой аттестации. Данный материал представляет собой субъективный результат обработки, структурирования и форматирования собранной его автором информации и предназначен, прежде всего, для использования в качестве источника для самостоятельной подготовки работы указанной тематики.
bmt: 0.00478
© Рефератбанк, 2002 - 2024