Код | 477535 | ||
Дата создания | 2021 | ||
Страниц | 25 ( 14 шрифт, полуторный интервал ) | ||
Источников | 14 | ||
Файлы
|
|||
Без ожидания: файлы доступны для скачивания сразу после оплаты.
Ручная проверка: файлы открываются и полностью соответствуют описанию. Документ оформлен в соответствии с требованиями ГОСТ.
|
Актуальность. С каждым годом количество информации, которое нужно хранить и использовать, увеличивается в геометрической прогрессии. Для этого человечество придумало специальную технологию, которая позволяет анализировать и хранить миллионы терабайт информации. Так что же такое Big Data? Каковы перспективы развития этой технологии в наше время? Данные вопросы как никогда актуальны.
Big Data — это различные инструменты, подходы и методы обработки как структурированных, так и неструктурированных данных для того, чтобы их использовать для конкретных задач и целей. Неструктурированные данные — это информация, которая не имеет заранее определённой структуры или не организована в определённом порядке.
Цели работы: познакомиться, изучить и проанализировать технологию Big Data; охарактеризовать и представить Big Data как технологию, без которой невозможно дальнейшее развитие человеческой цивилизации.
Задачи:
Теоретические основания исследования: при рассмотрении технологии мы опирались на статьи, раскрывающие принципы технологии Big Data и ее использование в разных сферах человеческой деятельности.
1.1 Термин «Big Data»
Термин Big Data относится к наборам данных, размер которых превосходит возможности типичных баз данных по хранению, управлению и анализу информации [5].
Big Data – это с одной стороны набор технологий, инструментов, методов и подходов, предназначенных для решения проблемы обработки больших объемов данных, а с другой стороны под Big Data понимают объем данных, который невозможно обработать общепринятыми, т.е. традиционными способами.
Результаты обработки больших массивов информации используются для выявления тенденций и закономерностей. Для больших компаний статистика и анализ данных всегда лежали в основе для ведения бизнеса на крупных рынках, но аналитический подход стал намного более востребованным с развитием телекоммуникаций и намного более эффективным благодаря наличию мощных вычислительных машин и современным методам обработки данных при помощи технологий искусственного интеллекта
...
1.3 Принципы «Big Data»
Распределенное хранение решает проблему большого объема данных, позволяя организовывать хранилище из произвольного числа отдельных простых носителей. Хранение может быть организовано с разной степенью избыточности, обеспечивая устойчивость к сбоям отдельных носителей.
Распределенная обработка с учетом локальности данных означает, что программа обработки доставляется на вычислитель, находящийся как можно ближе к обрабатываемым данным. Это принципиально отличается от традиционного подхода, когда вычислительные мощности и подсистема хранения разделены и данные должны быть доставлены на вычислитель. Таким образом, технологии Big Data опираются на вычислительные кластеры из множества вычислителей, снабженных локальной подсистемой хранения.
...
2.2 Big Data в сфере образования
Оперирование большими данными (Big Data) в образовании – это технология аналитики образовательной системы, включающей измерение, сбор, анализ и представление структурированных и неструктурированных данных огромных объемов об обучающихся и образовательной среде с целью понимания особенностей функционирования и развития образовательной системы.
В сфере образования выделяются пять основных типов данных:
...
2.3 Big Data в медиасфере
Использование метаданных в связях с общественностью является еще более новаторской тенденцией, чем в журналистике.
Актуальной тенденцией развития профессиональной социальной коммуникации в интернете является использование баз цифровой компьютерной информации, интернет-данных в различных, с технической точки зрения, форматах («большие данные, открытые большие данные, связанные данные, открытые связанные данные»).
Термин «база данных» («большие данные») сегодня применяется для обозначения различных типов баз данных, в том числе общественно значимых компьютерных данных, которые могут храниться в общем доступе, беспрепятственно использоваться аудиторией.
...
3 Положительные и отрицательные стороны использования Big Data
Проблемы системы Big Data можно свести к трем основным группам: объем, скорость обработки, неструктурированность. Это три V — Volume, Velocity и Variety.
Хранение больших объемов информации требует специальных условий, и это вопрос пространства и возможностей. Скорость связана не только с возможным замедлением и «торможением», вызываемом старыми методами обработок, это еще и вопрос интерактивности: чем быстрее процесс, тем больше отдача, тем продуктивнее результат. Проблема неоднородности и неструктурированности возникает по причине разрозненности источников, форматов и качества. Чтобы объединить данные и эффективно их обрабатывать, требуется не только работа по приведению их в пригодный для работы вид, но и определенные аналитические инструменты (системы).
...
ЗАКЛЮЧЕНИЕ
Цель данной работы заключалась в ознакомлении, изучении и анализе технологии Big Data; представлении Big Data в виде технологии, без которой невозможно дальнейшее развитие человеческой цивилизации
В ходе выполнения работы были решены следующие задачи:
1) Рассмотрены основные понятия, принципы технологии Big Data на основе анализа библиографических источников. Big Data – это с одной стороны набор технологий, инструментов, методов и подходов, предназначенных для решения проблемы обработки больших объемов данных, а с другой стороны под Big Data понимают объем данных, который невозможно обработать общепринятыми, т.е. традиционными способами. С точки зрения обработки в основу технологий Big Data положены два основных принципа: распределенного хранения данных; распределенной обработки, с учетом локальности данных.
...