Вход

Маркировка m-грамм с использованием ассоциативного контейнера

Рекомендуемая категория для самостоятельной подготовки:
Лабораторная работа*
Код 423450
Дата создания 2019
Страниц 1
Мы сможем обработать ваш заказ (!) 29 марта в 12:00 [мск]
Файлы будут доступны для скачивания только после обработки заказа.
1 150руб.
КУПИТЬ

Содержание

В архиве исходный код на языке C++ и файлы проекта codeblocks.

Введение

В архиве исходный код на языке C++ и файлы проекта codeblocks.

Фрагмент работы для ознакомления

Заказчик сделал положительный отзыв на работу, оценка - отлично.
Вариант 2 - «Маркировка m-грамм» с использованием ассоциативного контейнера
Написать программу маркировки произвольных m-грамм для текстов на русском и английском языке, используя ассоциативный контейнер (например, словарь).
m-грамма - это уникальная последовательность символов длиной m.
Необходимо при обработке произвольного текста подсчитать частоту встречаемости всевозможных подстрок длины m (маркировка m-грамм). Известно, что не все комбинации символов алфавита встречаются в тексте. Например, в русском языке последовательность символов «ыаоъъ» не возможна. Поэтому в целях экономии памяти для подсчёта рекомендуется использовать не массив элементов (он будет содержать большое количество нулевых элементов), а список элементов.
В качестве элемента словаря сохраняется пара: ключ - значение. Ключ - первая буква m-граммы. Значение - структура, содержащая:
 m-грамму;
 счётчик числа её повторений.
При занесении новой m-граммы в контейнер, счётчик полагается равным 1. Если, очередная встретившаяся m-грамма уже содержится в списке, то значение счётчика увеличивается на 1.
Предусмотреть пользовательское меню:
1. Загрузка m-грамм из файла (с указанием имени файла и размера m-граммы).
2. Вывод всех встреченных m-грамм с числом их повторений, отсортированных по алфавиту.
3. Вывод всех встреченных m-грамм с числом их повторений, начинающихся с заданной буквы.
4. Вывод сводной информации с указанием сколько всего уникальных m-грамм встретилось на каждую букву и их общее число.
5. Выход.
Входные данные берутся из файла. Длина m-грамм задаётся пользователем. Регистр букв не учитывать. Учитывать знаки препинания и пробелы (они не должны входить в m-граммы).
Пример:
Текст «Привет, мой дорогой друг!» содержит следующие m-граммы длиной 4:
прив
риве
ивет
доро
орог
рого
огой
дру

Список литературы

Нет
Очень похожие работы
Пожалуйста, внимательно изучайте содержание и фрагменты работы. Деньги за приобретённые готовые работы по причине несоответствия данной работы вашим требованиям или её уникальности не возвращаются.
* Категория работы носит оценочный характер в соответствии с качественными и количественными параметрами предоставляемого материала. Данный материал ни целиком, ни любая из его частей не является готовым научным трудом, выпускной квалификационной работой, научным докладом или иной работой, предусмотренной государственной системой научной аттестации или необходимой для прохождения промежуточной или итоговой аттестации. Данный материал представляет собой субъективный результат обработки, структурирования и форматирования собранной его автором информации и предназначен, прежде всего, для использования в качестве источника для самостоятельной подготовки работы указанной тематики.
bmt: 0.0048
© Рефератбанк, 2002 - 2024