Код | 525223 |
Дата создания | 2021 |
Мы сможем обработать ваш заказ (!) 9 декабря в 12:00 [мск]
Файлы будут доступны для скачивания только после обработки заказа.
|
Кластеризация пользователей в социальных сетях очень важна по многим причинам. В области кибербезопасности изучение кластеров помогает моделировать поведение и влияние сети, также идентифицировать структуру сообщества. Например, помогает обнаруживать угрозы, вредоносное ПО, интернет-ботов или спам-пользователей, а также измерять достоверность информации и пользователей, например, для получения достоверного анализа или отзывов о продуктах или для того, чтобы узнать потребности людей с социальных сетях. Кроме того, более раннее знание аудитории помогает компаниям и маркетологам кластеризовать своих подписчиков по разным сообществам, чтобы иметь с ними эффективное и целевое взаимодействие. Например, если рекламодатели связывают трех человек как друзей, коллег или членов семьи, и двое из них покупают продукт рекламодателя, то они могут потратить больше на рекламу третьему человеку, полагая, что этот человек имеет высокую вероятность купить их продукт [3].
Можно прийти к выводу, что тема данной дипломной работы является актуальной.
Объектом исследования данной работы является социальная сеть.
Предметом исследования данной работы является кластеризация пользователей в социальной сети.
Целью работы является разработка информационной системы для кластеризации подписчиков пользователя социальной сети.
Для достижения поставленной цели требуется решение следующих
задач:
1. Изучить теоретические подходы к проблеме кластеризации;
2. Провести анализ существующих систем для кластеризации;
3. Выбрать инструменты для проектирования информационной системы;
4. Собрать данных из социальной сети;
5. Разработать информационную систему;
6. Кластеризовать данные;
7. Построить граф;
8. Проанализировать функции системы и полученные данные.
АННОТАЦИЯ 3
ВВЕДЕНИЕ 4
1. Исследование проблемы кластеризации элементов социальной сети 6
1.1. Теоретические подходы кластеризации данных 6
1.2. Обзор существующих информационных систем кластеризации 11
2. Разработка информационной системы 14
2.1. Инструменты для извлечения и анализа данных 14
2.2. Сбор данных из социальной сети Instagram 15
2.3. Разработка интерфейса 18
2.4. Реализация метода Лувена 20
3. Анализ функционирования системы 22
3.1. Тестирование информационной системы 22
3.2. Анализ процесса визуализации графа 22
3.3. Анализ эффективности системы при исследовании сети 27
ЗАКЛЮЧЕНИЕ 31
СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ 33
ПРИЛОЖЕНИЕ 35
1. Global digital population as of January 2021 [Электронный ресурс] Режим доступа: URL: https://www.statista.com/statistics/617136/ (Дата обращения 15.01.2021).
2. Интернет и соцсети в России в 2021 году — вся статистика [Электронный ресурс] Режим доступа: URL: https://www.web- canape.ru/business/internet-i-socseti-v-rossii-v-2021-godu-vsya-statistika/ (Дата обращения 15.01.2021).
3. Социальные сети [Электронный ресурс] Режим доступа: URL: https://brilliant.org/wiki/social-networks/ (Дата обращения 16.01.2021)
4. Clustering — When You Should Use it and Avoid It [Электронный ресурс] Режим доступа: URL: https://www.explorium.ai/blog/clustering- when-you-should-use-it-and-avoid-it/ (Дата обращения 01.02.2021)
5. Unsupervised Learning and Data Clustering [Электронный ресурс] Режим доступа: URL: https://towardsdatascience.com/unsupervised-learning-and- data-clustering-eeecb78b422a (Дата обращения 01.02.2021)
6. Кластеризация K-средних [Электронный ресурс] Режим доступа: URL: https://www.saedsayad.com/clustering_kmeans.htm (Дата обращения 06.02.2021)
7. Алгоритм нечеткой кластеризации c-средних [Электронный ресурс] Режим доступа: URL: https://sites.google.com/site/dataclusteringalgorithms/fuzzy-c-means- clustering-algorithm (Дата обращения 02.04.2021)
8. What is Hierarchical Clustering [Электронный ресурс] Режим доступа: URL: https://www.displayr.com/what-is-hierarchical-clustering (Дата обращения 20.02.2021)
9. Gephi [Электронный ресурс] Режим доступа: URL: https://gephi.org/users/publications/(Дата обращения 20.01.2021).
10. Clustering [Электронный ресурс] Режим доступа: URL: https://docs.yworks.com/yfiles-html/dguide/analysis/analysis-clustering.html (Дата обращения 14.03.2021)
11. Orange Workflows [Электронный ресурс] Режим доступа: URL: https://orangedatamining.com/workflows/ (Дата обращения 14.03.2021)
12. Extract insights from your data [Электронный ресурс] Режим доступа: URL: https://www.knime.com/model-visualize (Дата обращения 14.03.2021)
13. Что такое Selenium WebDriver? [Электронный ресурс] Режим доступа: URL: https://habr.com/ru/post/152971/ (Дата обращения 20.02.2021)
14. Силовые алгоритмы визуализации графов [Электронный ресурс] Режим доступа: URL: https://oktmo.ru/stati/32296-silovye-algoritmy- vizualizacii-grafov.html/ (Дата обращения 30.03.2021)