Рекомендуемая категория для самостоятельной подготовки:
Курсовая работа*
Код |
585885 |
Дата создания |
2014 |
Страниц |
30
|
Мы сможем обработать ваш заказ (!) 23 декабря в 12:00 [мск] Файлы будут доступны для скачивания только после обработки заказа.
|
Содержание
Введение 2
1. WEB2.0 – рабочая среда автоматизированной журналистики 4
1.2 Принцип действия роботов - генераторов контента 12
2. Обзор существующих программных решений 21
2.1 Magic article rewriter 23
2.2. Power Article Rewriter 24
2.3 Article Rewrite Worker 25
2.4 WordFlood 2.0 26
2.5 Другие автоматические генераторы веб-контента 27
Заключение. 28
Список литературы. 30
Введение
В конце апреля 2010 года, сотрудники американского Северо-Западного университета (Northwestern University) провели интересный эксперимент. Они пригласили нескольких профессиональных спортивных редакторов из чикагских изданий и предложили им оценить по пятибалльной шкале три небольших заметки, посвященных финальному бейсбольному матчу между университетскими командами. В результате голосования одна заметка получила заметно больше баллов, чем другие. Редакторы похвалили ее за информативность, лаконичность, правильную последовательность изложения фактов, умение автора фильтровать второстепенную информацию.
Журналисты были сильно удивлены, когда им сообщили, что лучшая заметка написана не человеком, а сгенерирована специальной программой. Два других текста написали студенты старших курсов факультета спортивной информации Школы журналистики Медилла того же Северо-Западного университета.
Эксперимент был презентацией стартапа Narrative Sciencе, специализирующегося на «machine-generated content» – автоматической генерации контента .
Данный программный продукт является представителем автоматизированной журналистики, явления малоизученного но набирающего обороты популярности.
В отечественной науке соотношении пертинентности и релевантности одним из первых начал изучать выдающийся библиотековед и социолог А.В. Соколов . Из современных русскоязычных авторов, наиболее активно касающихся этой проблематики, стоит назвать также специалиста в области семантического обеспечения интернет-сервисов Д.В. Ландэ.
Цель курсовой работы - исследование области автоматизированной журналистики, практики её использования.
Задачи, которые были поставлены при написании данной работы:
-выявление существующих программных продуктов, работающих в области автоматизированной журналистики
- обзор существующих программных продуктов, работающих в области автоматизированной журналистики
- анализ рабочей среды – функционирования роботов краулеров - объектов автоматизированной журналистики
Фрагмент работы для ознакомления
Подводя итог, скажем, что перспективы перед гуманитарными исследованиями от использования автоматизированных систем тематической индексации открываются необъятные. Можно предположить, что в перспективе, реализация идеи тематической индексации приведёт к специализации интернет-поисковиков. Она также позволит поисковым программам операционных систем автоматически создавать рубрицированный каталог всех электронных текстов на персональных компьютерах.
Тематический поисковик сможет индексировать файлы и сайты
по ограниченному набору тематик из какой-либо узкой предметной области, скажем из истории России, но зато предельно корректно.
В интеллектуальных поисковиках будущего можно будет исключать из результатов поиска не просто нежелательные слова (их всех не предусмотришь), но и нежелательные тематики; регулировать ранжирование результатов поиска по степени доминирования тематики в текстах или в их фрагментах. Тривиальный поиск по словам, конечно, тоже останется, но он будет уже иметь вторичный характер.
Априорные величины для тематической индексации текстов по формуле Байеса могут сформировать только гуманитарии – специалисты в дискурсивных особенностях тех областей знаний, для которых происходит обработка текстов и документов. Речь идёт в частности о составлении дисциплинарных, субдисциплинарных и междисциплинарных идеографических словарей нового типа. В таких словарях по каждой предметно-тематической рубрике будет содержаться список и объяснение всех контекстно-инвариантных употреблений определённых словоформ, понятий или идиом. Для обозначения подобных «сборников контекстов» (с перечислением, но без анализа) в корпусной лингвистике используется термин «конкорданс». Однако существующие конкордансы носят исключительно языковедческо-справочный характер. Здесь же имеется в виду создание неких предметных баз знаний.
Эвристические возможности фильтрации, сортировки и компоновки информации в такой базе знаний как раз и откроет новые горизонты гуманитаристики. Они станут действенным поводом для новых форм рефлексии гуманитариев над методами и целями своих исследований, над своими языками и текстами, и предоставят широкой аудитории новые поводы заинтересоваться этими текстами. Будь то классические философские трактаты, электронные архивы сообщений СМИ за прошлые годы, базы данных с отчётной отраслевой документацией, протоколы заседаний или любые иные корпуса текстов. У гуманитариев помимо задачи «выписывать из разных книжек в одну тетрадку», появятся новые более творческие задачи, связанные с поиском способов автоматизации конспектирования, реферирования и аннотирования текстов. Автоматизация настраиваемых субдисциплинарных рубрикаций, ранжирования и комбинаторики текстов создаёт новые стимулы их прочтения, новые направления интересов, новые способы интерпретации описанных в текстах событий и явлений. Соответственно, всё это может открыть и новые перспективы гуманитарных наук XXI века.
Список литературы
1. Биргер П. «Я не верю в роботов-журналистов, но знаю, что часть журналистcкой работы могут выполнять роботы». Основатель стартапа Narrative Sciencе Стюарт Френкель рассказал Slon.ru о том, как компьютеры могут заменить работников СМИ//Slon.- Режим доступа: http://slon.ru/
2. Соколов А.В. Метатеория социальной коммуникации. - СПб., 2002.- 470 с.
3. Ландэ Д.В. Поиск знаний в Internet.- Киев, 2010.- 320 с.
4. Маркова, М.В. Порождение уникального WEB-контента на основе аннотированного текста / Материалы XLIX Международной Студенческой Конференции «Студент и научно-технический прогресс»: Информационные технологии (16-20 апреля 2011 г.).Новосиб. гос. ун-т. Новосибирск, 2011. – С. 209.
5. Официальный информационный ресурс продукта Power Article Rewriter [Электронный ресурс]. – Режим доступа: http://powerarticlerewriter.com/, свободный.
6. Официальный ресурс продукта Article Rewrite Worker / [Электронный ресурс]. –Режим доступа: http://www.articlerewriteworker.com/, свободный.
7. Официальный ресурс проекта WordFlood / [Электронный ресурс]. – Режим доступа:http://www.wordflood.com/, свободный.
8. Бочаров А.В. Автоматизация обработки неструктурированной текстовой информации и перспективы гуманитарных наук в XXI веке//Человек-текст-эпоха. -Томск: Изд-во ТГУ, 2011.- Вып. 4.- С. 15-37.
Пожалуйста, внимательно изучайте содержание и фрагменты работы. Деньги за приобретённые готовые работы по причине несоответствия данной работы вашим требованиям или её уникальности не возвращаются.
* Категория работы носит оценочный характер в соответствии с качественными и количественными параметрами предоставляемого материала. Данный материал ни целиком, ни любая из его частей не является готовым научным трудом, выпускной квалификационной работой, научным докладом или иной работой, предусмотренной государственной системой научной аттестации или необходимой для прохождения промежуточной или итоговой аттестации. Данный материал представляет собой субъективный результат обработки, структурирования и форматирования собранной его автором информации и предназначен, прежде всего, для использования в качестве источника для самостоятельной подготовки работы указанной тематики.
bmt: 0.00469