Вход

Кластеризация и классификация текстов

Рекомендуемая категория для самостоятельной подготовки:
Дипломная работа*
Код 548121
Дата создания 2023
Мы сможем обработать ваш заказ (!) 2 мая в 12:00 [мск]
Файлы будут доступны для скачивания только после обработки заказа.
2 410руб.
КУПИТЬ

Описание

2023 год

Сдана на отлично.

Проверена бесплатно в ап.ру

Рассмотрены существующие техники кластеризации текстов, проанализированы присущие им слабые стороны, препятствующие удовлетворению сформулированных выше требований, выполнена классификация текста с предварительной кластеризацией по выбранным методам и классификацию без предварительной кластеризации и выведены результаты классификаций.

Содержание

ВВЕДЕНИЕ 2

1 Аналитический обзор литературы 6

1.1 Актуальность проблемы 6

1.2 Алгоритмы кластеризации и метрики оценки 9

1.3 Алгоритм k средних (k-means) 13

1.4 Иерархическая кластеризация 20

1.5 DBSCAN 24

1.6 Сравнение алгоритмов 30

1.7 Классификация текста 31

2 Специальная часть 35

2.1 Содержательная постановка задачи 35

2.2 Математическая постановка задачи 35

2.3 Программная реализация 36

2.4 Результаты исследования 36

ЗАКЛЮЧЕНИЕ 38

СПИСОК ИСПОЛЬЗУЕМЫХ ИСТОЧНИКОВ 39

ПРИЛОЖЕНИЕ 40

Список литературы

1 Jiawei Han, Micheline Kamber, Jian Pei, "Data Mining: Concepts and Techniques", 2011. 456 c.

2 Brian S. Everitt, Sabine Landau, Morven Leese, "Cluster Analysis: Basic Concepts and Algorithms", 2020. 20 c.

..

20 R-дерево [Электронный ресурс] URL: https://clck.ru/UVNpq

21 Алёшин Н. А. "Техника и технологии: теория и практика", 2020, c. 9.

22 Гиперплоскость [Электронный ресурс] URL: https://clck.ru/34KMLv

Очень похожие работы
Пожалуйста, внимательно изучайте содержание и фрагменты работы. Деньги за приобретённые готовые работы по причине несоответствия данной работы вашим требованиям или её уникальности не возвращаются.
* Категория работы носит оценочный характер в соответствии с качественными и количественными параметрами предоставляемого материала. Данный материал ни целиком, ни любая из его частей не является готовым научным трудом, выпускной квалификационной работой, научным докладом или иной работой, предусмотренной государственной системой научной аттестации или необходимой для прохождения промежуточной или итоговой аттестации. Данный материал представляет собой субъективный результат обработки, структурирования и форматирования собранной его автором информации и предназначен, прежде всего, для использования в качестве источника для самостоятельной подготовки работы указанной тематики.
bmt: 0.00437
© Рефератбанк, 2002 - 2024