Министерство образования РФ.
Новгородский государственный университет имени Ярослава Мудрого.
Кафедра математики и информатики.
Лабораторная работа №6
по дисциплине «Информатика»
«Архивация данных»
ОТЧЕТ.
Преподаватель
Винник Людмила Ивановна
_____________
студент
*****************
Гр. 3311.
_____________
Великий Новгород
2004.
1. ЦЕЛЬ РАБОТЫ
Целью работы является изучение основных видов программ-архиваторов, алгоритмов архивации данных, приобретение практических навыков их использования.
2. ОСНОВНЫЕ ТЕОРЕТИЧЕСКИЕ ПОЛОЖЕНИЯ
2.1 Применение архиваторов
Раньше в вычислительных машинах для хранения больших объемов информации в течение длительного времени использовались накопители на магнитных лентах, которые обладали колоссальной емкостью, а сжатие информации на диске было нерациональным решением, так как работа с ней в таком виде отнимала драгоценное машинное время. Необходимость в архиваторах возникла, когда появились персональные компьютеры, и для хранения в них информации использовались дискеты и жесткие диски первоначально небольшой емкости. Повышение скорости работы процессоров персональных компьютеров в середине 80-х годов позволило создать утилиты, сжимающие информацию в два раза.
С развитием компьютера стали увеличиваться и объемы информации хранимой в нем, что в свою очередь привело к развитию технологий по хранению этой информации в сжатом виде, то есть в архивах. Для этого было придумано множество программ осуществляющих архивацию информации.
Архиваторы в основном использовались для резервного копирования и переноса информации. При хранении копий файлов в сжатом виде они занимают меньше места, к тому же удобнее оперировать с одним или несколькими файлами, чем с большим количеством файлов и директорий. Не потеряли архиваторы актуальности и теперь, однако требования, предъявляемые пользователям к этой категории программных продуктов, существенно изменились. Если раньше едва ли не самым важным было требование по максимальному сжатию информации, хотя бы в силу дороговизны на тот момент носителей информации - в первую очередь распространялись архиваторы, удовлетворяющие именно этому требованию, то теперь ситуация значительно изменилась и на первое место встают простота и удобство в использовании.
Еще одним немаловажным требованием, предъявляемым к архиваторам при переносе информации, была его распространенность, т. е. чтобы при передаче информации не приходилось в придачу передавать и сам архиватор
2.2 Понятие процесса архивации файлов
Одним из наиболее широко распространенных видов сервисных программ являются программы, предназначенные для архивации, упаковки файлов путем сжатия хранимой в них информации.
Сжатие информации — это процесс преобразования информации, хранящейся в файле, к виду, при котором уменьшается избыточность в ее представлении и соответственно требуется меньший объем памяти для хранения.
Сжатие информации в файлах производится за счет устранения избыточности различными способами, например за счет упрощения кодов, исключения из них постоянных битов или представления повторяющихся символов или повторяющейся последовательности символов в виде коэффициента повторения и соответствующих символов. Применяются различные алгоритмы подобного сжатия информации.
Сжиматься могут как один, так и несколько файлов, которые в сжатом виде помещаются в так называемый архивный файл или архив.
Архивный файл — это специальным образом организованный файл, содержащий в себе один или несколько файлов в сжатом или несжатом виде и служебную информацию об именах файлов, дате и времени их создания или модификации, размерах и т.п.
Целью упаковки файлов обычно являются обеспечение более компактного размещения информации на диске, сокращение времени и соответственно стоимости передачи информации по каналам связи в компьютерных сетях. Кроме того, упаковка в один архивный файл группы файлов существенно упрощает их перенос с одного компьютера на другой, сокращает время копирования файлов на диски, позволяет защитить информацию от несанкционированного доступа, способствует защите от заражения компьютерными вирусами.
Степень сжатия зависит от используемой программы, метода сжатия и типа исходного файла. Наиболее хорошо сжимаются файлы графических образов, текстовые файлы и файлы данных, для которых степень сжатия может достигать 5 - 40%, меньше сжимаются файлы исполняемых программ и загрузочных модулей — 60 - 90%. Почти не сжимаются архивные файлы. Программы для архивации отличаются используемыми методами сжатия, что соответственно влияет на степень сжатия.
Архивация (упаковка) — помещение (загрузка) исходных файлов в архивный файл в сжатом или несжатом виде. Разархивация (распаковка) — процесс восстановления файлов из архива точно в таком виде, какой они имели до загрузки в архив. При распаковке файлы извлекаются из архива и помещаются на диск или в оперативную память;
Архиваторы - это программы, позволяющие создавать и обрабатывать архивные копии файлов. При этом архивные копии имеют меньший размер, чем оригиналы. С помощью специальных алгоритмов сжатия из файлов удаляется вся избыточная информация, а при применении обратных алгоритмов распаковки архивная копия восстанавливается в первоначальном виде.
Программы-архиваторы позволяют создавать и такие архивы, для извлечения из которых содержащихся в них файлов не требуются какие-либо программы, так как сами архивные файлы могут содержать программу распаковки. Такие архивные файлы называются самораспаковывающимися.
Самораспаковывающийся архивный файл — это загрузочный, исполняемый модуль, который способен к самостоятельной разархивации находящихся в нем файлов без использования программы-архиватора.
Самораспаковывающийся архив получил название SFX-архив (SelF-eXtracting). Архивы такого типа в MS DOS обычно создаются в форме .ЕХЕ-файла.
Большие по объему архивные файлы могут быть размещены на нескольких дисках (томах). Такие архивы называются многотомными. Том — это составная часть многотомного архива. Создавая архив из нескольких частей, можно записать его части на несколько дискет.
Сжатие информации - проблема, имеющая достаточно давнюю историю, гораздо более давнюю, нежели история развития вычислительной техники, которая (история) обычно шла параллельно с историей развития проблемы кодирования и шифровки информации.
Все алгоритмы сжатия оперируют входным потоком информации, минимальной единицей которой является бит, а максимальной - несколько бит, байт или несколько байт.
Целью процесса сжатия, как правило, есть получение более компактного выходного потока информационных единиц из некоторого изначально некомпактного входного потока при помощи некоторого их преобразования.
Основными техническими характеристиками процессов сжатия и результатов их работы являются:
* степень сжатия (compress rating) или отношение (ratio) объемов исходного и результирующего потоков;
* скорость сжатия - время, затрачиваемое на сжатие некоторого объема информации входного потока, до получения из него эквивалентного выходного потока;
* качество сжатия - величина, показывающая на сколько сильно упакован выходной поток, при помощи применения к нему повторного сжатия по этому же или иному алгоритму.
2.3. Алгоритмы архивации данных
Все способы сжатия можно разделить на две категории: обратимое (сжатие без потерь) и необратимое сжатие.
Под необратимым сжатием подразумевают такое преобразование входного потока данных, при котором выходной поток, основанный на определенном формате информации, представляет, с некоторой точки зрения, достаточно похожий по внешним характеристикам, на входной поток объект, однако отличается от него объемом.
Такие подходы и алгоритмы используются для сжатия, например данных растровых графических файлов с низкой степенью повторяемости байтов в потоке. При таком подходе используется свойство структуры формата графического файла и возможность представить графическую картинку приблизительно схожую по качеству отображения (для восприятия человеческим глазом) несколькими (а точнее n) способами. Поэтому, кроме степени или величины сжатия, в таких алгоритмах возникает понятие качества, т.к. исходное изображение в процессе сжатия изменяется, то под качеством можно понимать степень соответствия исходного и результирующего изображения, оцениваемая субъективно, исходя из формата информации. Для графических файлов такое соответствие определяется визуально, хотя имеются и соответствующие интеллектуальные алгоритмы и программы. Необратимое сжатие невозможно применять в областях, в которых необходимо иметь точное соответствие информационной структуры входного и выходного потоков. Данный подход реализован в популярных форматах представления видео и фото информации, известных как JPEG и JFIF алгоритмы и JPG и JIF форматы файлов.
Обратимое сжатие всегда приводит к снижению объема выходного потока информации без изменения его информативности, т.е. - без потери информационной структуры.
Более того, из выходного потока, при помощи восстанавливающего или декомпрессирующего алгоритма, можно получить входной, а процесс восстановления называется декомпрессией или распаковкой и только после процесса распаковки данные пригодны для обработки в соответствии с их внутренним форматом.
Перейдем теперь непосредственно к алгоритмическим особенностям обратимых алгоритмов и рассмотрим важнейшие теоретические подходы к сжатию данных, связанные с реализацией кодирующих систем и способы сжатия информации.
2.3. 1 Алгоритмы сжатия без потерь
2.3.1.1. Сжатие способом кодирования серий (RLE)
Наиболее известный простой подход и алгоритм сжатия информации обратимым путем - это кодирование серий последовательностей (Run Length Encoding - RLE).
Суть методов данного подхода состоит в замене цепочек или серий повторяющихся байтов или их последовательностей на один кодирующий байт и счетчик числа их повторений.
Например:
44 44 44 11 11 11 11 11 01 33 FF 22 22 - исходная последовательность
03 44 05 11 01 01 01 33 01 FF 02 22 - сжатая последовательность
Первый байт указывает сколько раз нужно повторить следующий байт
Если первый байт равен 00, то затем идет счетчик, показывающий сколько за ним следует неповторяющихся данных.
Данные методы, как правило, достаточно эффективны для сжатия растровых графических изображений (BMP, PCX, TIF, GIF), т.к. последние содержат достаточно много длинных серий повторяющихся последовательностей байтов.
Недостатком метода RLE является достаточно низкая степень сжатия.
2.3.1.2 Алгоритм Хаффмана
Сжимая файл по алгоритму Хаффмана первое что мы должны сделать - это необходимо прочитать файл полностью и подсчитать сколько раз встречается каждый символ из расширенного набора ASCII.
Если мы будем учитывать все 256 символов, то для нас не будет разницы в сжатии текстового и EXE файла.
После подсчета частоты вхождения каждого символа, необходимо просмотреть таблицу кодов ASCII и сформировать бинарное дерево.
Пример:
Мы имеем файл длинной в 100 байт и имеющий 6 различных символов в себе . Мы подсчитали вхождение каждого из символов в файл и получили следующее :
Теперь мы берем эти числа и будем называть их частотой вхождения для каждого символа.
Мы возьмем из последней таблицы 2 символа с наименьшей частотой. В нашем случае это D (5) и какой либо символ из F или A (10), можно взять любой из них например A.
Сформируем из "узлов" D и A новый "узел", частота вхождения для которого будет равна сумме частот D и A :
Номер в рамке - сумма частот символов D и A. Теперь мы снова ищем два символа с самыми низкими частотами вхождения. Исключая из просмотра D и A и рассматривая вместо них новый "узел" с суммарной частотой вхождения. Самая низкая частота теперь у F и нового "узла". Снова сделаем операцию слияния узлов :
Рассматриваем таблицу снова для следующих двух символов ( B и E ).
Мы продолжаем в этот режим пока все "дерево" не сформировано, т.е. пока все не сведется к одному узлу.
Теперь когда наше дерево создано, мы можем кодировать файл . Мы должны всегда начинать из корня ( Root ). Кодируя первый символ (лист дерева С) Мы прослеживаем вверх по дереву все повороты ветвей и если мы делаем левый поворот, то запоминаем 0-й бит, и аналогично 1-й бит для правого поворота. Так для C, мы будем идти влево к 55 ( и запомним 0 ), затем снова влево (0) к самому символу . Код Хаффмана для нашего символа C - 00. Для следующего символа ( А ) у нас получается - лево,право,лево,лево , что выливается в последовательность 0100. Выполнив выше сказанное для всех символов получим
C = 00 ( 2 бита )
A = 0100 ( 4 бита )
D = 0101 ( 4 бита )
F = 011 ( 3 бита )
B = 10 ( 2 бита )
E = 11 ( 2 бита )
При кодировании заменяем символы на данные последовательности.
2.3.1.3 Арифметическое кодирование
Совершенно иное решение предлагает т.н. арифметическое кодирование. Арифметическое кодирование является методом, позволяющим упаковывать символы входного алфавита без потерь при условии, что известно распределение частот этих символов и является наиболее оптимальным, т.к. достигается теоретическая граница степени сжатия.
Предполагаемая требуемая последовательность символов, при сжатии методом арифметического кодирования рассматривается как некоторая двоичная дробь из интервала [0, 1). Результат сжатия представляется как последовательность двоичных цифр из записи этой дроби.
Идея метода состоит в следующем: исходный текст рассматривается как запись этой дроби, где каждый входной символ является "цифрой" с весом, пропорциональным вероятности его появления. Этим объясняется интервал, соответствующий минимальной и максимальной вероятностям появления символа в потоке.
Пример.
Пусть алфавит состоит из двух символов: a и b с вероятностями соответственно 0,75 и 0,25.
Рассмотрим наш интервал вероятностей [0, 1). Разобьем его на части, длина которых пропорциональна вероятностям символов. В нашем случае это [0; 0,75) и [0,75; 1). Суть алгоритма в следующем: каждому слову во входном алфавите соответствует некоторый подинтервал из интервала [0, 1) а пустому слову соответствует весь интервал [0, 1). После получения каждого следующего символа интервал уменьшается с выбором той его части, которая соответствует новому символу. Кодом цепочки является интервал, выделенный после обработки всех ее символов, точнее, двоичная запись любой точки из этого интервала, а длина полученного интервала пропорциональна вероятности появления кодируемой цепочки.
Применим данный алгоритм для цепочки "aaba":
Границы интервала вычисляются так берется расстояние внутри интервала (0,5625-0,421875=0,140625), делится на частоты [0; 0,10546875) и [0,10546875; 1) и находятся новые границы [0,421875; 0,52734375) и [0,52734375; 0,5625).
В качестве кода можно взять любое число из интервала, полученного на шаге 4, например, 0,43.
Алгоритм декодирования работает аналогично кодирующему. На входе 0,43 и идет разбиение интервала.
Продолжая этот процесс, мы однозначно декодируем все четыре символа. Для того, чтобы декодирующий алгоритм мог определить конец цепочки, мы можем либо передавать ее длину отдельно, либо добавить к алфавиту дополнительный уникальный символ - "конец цепочки".
2.3.1.4 Алгоритм Лемпеля – Зива - Велча (Lempel-Ziv-Welch - LZW)
Данный алгоритм отличают высокая скорость работы как при упаковке, так и при распаковке, достаточно скромные требования к памяти и простая аппаратная реализация.
Недостаток - низкая степень сжатия по сравнению со схемой двухступенчатого кодирования.
Предположим, что у нас имеется словарь, хранящий строки текста и содержащий порядка от 2-х до 8-ми тысяч пронумерованных гнезд. Запишем в первые 256 гнезд строки, состоящие из одного символа, номер которого равен номеру гнезда.
Алгоритм просматривает входной поток, разбивая его на подстроки и добавляя новые гнезда в конец словаря. Прочитаем несколько символов в строку s и найдем в словаре строку t - самый длинный префикс s.
Пусть он найден в гнезде с номером n. Выведем число n в выходной поток, переместим указатель входного потока на length(t) символов вперед и добавим в словарь новое гнездо, содержащее строку t+c, где с - очередной символ на входе (сразу после t). Алгоритм преобразует поток символов на входе в поток индексов ячеек словаря на выходе.
При практической реализации этого алгоритма следует учесть, что любое гнездо словаря, кроме самых первых, содержащих одно-символьные цепочки, хранит копию некоторого другого гнезда, к которой в конец приписан один символ. Вследствие этого можно обойтись простой списочной структурой с одной связью.
Пример: ABCABCABCABCABCABC - 1 2 3 4 6 5 7 7 7
1 |
A |
2 |
B |
3 |
C |
4 |
AB |
5 |
BC |
6 |
CA |
7 |
ABC |
8 |
CAB |
9 |
BCA |
2.3.1.5 Двухступенчатое кодирование. Алгоритм Лемпеля-Зива
Гораздо большей степени сжатия можно добиться при выделении из входного потока повторяющихся цепочек - блоков, и кодирования ссылок на эти цепочки с построением хеш таблиц от первого до n-го уровня.
Метод, о котором и пойдет речь, принадлежит Лемпелю и Зиву и обычно называется LZ-compression.
Суть его состоит в следующем: упаковщик постоянно хранит некоторое количество последних обработанных символов в буфере. По мере обработки входного потока вновь поступившие символы попадают в конец буфера, сдвигая предшествующие символы и вытесняя самые старые.
Размеры этого буфера, называемого также скользящим словарем (sliding dictionary), варьируются в разных реализациях кодирующих систем.
Экспериментальным путем установлено, что программа LHarc использует 4-килобайтный буфер, LHA и PKZIP - 8-ми, а ARJ - 16-килобайтный.
Затем, после построения хеш таблиц алгоритм выделяет (путем поиска в словаре) самую длинную начальную подстроку входного потока, совпадающую с одной из подстрок в словаре, и выдает на выход пару (length, distance), где length - длина найденной в словаре подстроки, а distance - расстояние от нее до входной подстроки (то есть фактически индекс подстроки в буфере, вычтенный из его размера).
В случае, если такая подстрока не найдена, в выходной поток просто копируется очередной символ входного потока.
В первоначальной версии алгоритма предлагалось использовать простейший поиск по всему словарю. Однако, в дальнейшем, было предложено использовать двоичное дерево и хеширование для быстрого поиска в словаре, что позволило на порядок поднять скорость работы алгоритма.
Таким образом, алгоритм Лемпеля-Зива преобразует один поток исходных символов в два параллельных потока длин и индексов в таблице (length + distance).
Очевидно, что эти потоки являются потоками символов с двумя новыми алфавитами, и к ним можно применить один из упоминавшихся выше методов (RLE, кодирование Хаффмана или арифметическое кодирование).
Так мы приходим к схеме двухступенчатого кодирования - наиболее эффективной из практически используемых в настоящее время. При реализации этого метода необходимо добиться согласованного вывода обоих потоков в один файл. Эта проблема обычно решается путем поочередной записи кодов символов из обоих потоков.
Пример:
Первая ступень
abcabcabcabcabc - 1 а 1 b 1 c 3 3 6 3 9 3 12 3
Вторая ступень - исключение большой группы повторяющихся последовательностей
1 а 1 b 1 c 12 3
и сжатие RLE, кодирование Хаффмана , арифметическое кодирование
Перечень программ сжатия с кратким указанием алгоритмов их работы.
PKPAK 3.61:
Метод Packed -- алгоритм RLE.
Метод Crunched -- алгоритм LZW.
Метод Squashed -- двухпроходное статическое кодирование Хаффмана.
PKZIP 1.10:
Метод Shrinked -- модифицированный алгоритм LZW с частичной очисткой словаря и переменной длиной кода.
Метод Imploded -- модифицированный алгоритм Лемпеля-Зива и
статическое кодирование Хаффмана.
LHArc:
Алгоритм Лемпеля-Зива и динамическое кодирование Хаффмана.
LHA:
Алгоритм Лемпеля-Зива и статическое кодирование Хаффмана.
ARJ:
Алгоритм Лемпеля-Зива и оригинальный метод кодирования
2.3.2 Алгоритмы сжатия с потерями
2.3.2.1 Особенности сжатия графики
Напомним, что растровые изображения представляют собой двумерный массив чисел - пикселей, а изображения можно подразделить на две группы: с палитрой и без нее. У первых в пикселе хранится число - индекс в некотором одномерном векторе цветов, называемом палитрой (из 16 и 256 цветов).
Изображения без палитры бывают в какой-либо системе цветопредставления и в градациях серого. При использовании некой системы цветопредставления каждый пиксель является структурой, полями которой являются компоненты цвета (например, RGB и CMYK).
На заре компьютерной эры для сжатия графики применялись традиционные алгоритмы, рассмотренные выше. С появлением новых типов изображений эти алгоритмы утратили эффективность. Многие изображения практически не сжимались, хотя обладали явной избыточностью. Тогда и появились алгоритмы с потерей информации. Как правило, в них можно задавать коэффициент сжатия (т. е. степень потерь качества).
Алгоритмы сжатия с потерями не рекомендуется использовать при сжатии изображений, которые затем будут предназначены для печати с высоким качеством или для обработки с помощью ПО распознавания образов.
2.3.2.2 Фрактальное сжатие
Так называемые фрактальные алгоритмы обеспечивают степень сжатия изображения до 1:2000 (формат FIF). Кроме того, при разархивации изображение можно масштабировать. Уникальность этих алгоритмов в том, что изображение не дробится на квадраты и учитывается не близость цветов в локальной области, а подобие разных по размеру областей изображения.
Фрактальные алгоритмы ориентированы на полноцветные изображения и изображения в градациях серого. Они требуют огромных вычислительных мощностей при архивации, зато распаковка менее ресурсоемка, чем JPEG.
За годы с момента возникновения первой программы данного типа написаны сотни различных архиваторов, поддерживающих различные форматы архивов. На момент становления и развития архиваторов самым распространенным форматом был ARJ, на втором месте почти сразу за ним ZIP, с некоторым отрывом следовали такие архиваторы, как ARC, ACE, LZH. На данный момент ситуация значительно изменилась. Первое место среди форматов архиваторов занимает ZIP, отвоевав его у ARJ, который отошел теперь на задний план, на втором месте RAR и со значительным отрывом следуют ACE, ARJ и другие менее популярные форматы.
Таким образом, в нашем обзоре нас интересуют в первую очередь архиваторы самых распространенных форматов:
ZIP - формат был разработан PKWARE.
RAR - формат был разработан Евгением Рошалем, автором одноименного архиватора и благодаря удобному интерфейсу архиватора одновременно с хорошим сжатием завоевал популярность.
2.4 Основные виды программ-архиваторов
Наиболее известные программы-архиваторы для MS-DOS: ARJ (разработчик -- Robert K. Jung), pkzip (компания PKWARE Inc.), lha (Haruyasu Yoshizaki), zoo (Rahul Dhesi). Безусловным лидером во всем мире за последние 5 лет стал архиватор RAR. В настоящее время RAR активно вытесняет ZIP как основную утилиту сжатия FTP архивов в сети INTERNET. RAR я является единственной всемирно используемой программой, созданной русским программистом (за исключением TETRIS). Все архиваторы отличаются используемыми алгоритмами сжатия, форматами архивных файлов, скоростью работы и т.д.
В настоящее время применяется несколько десятков программ-архиваторов, которые отличаются перечнем функций и параметрами работы, однако лучшие из них имеют примерно одинаковые характеристики. Из числа наиболее популярных программ можно выделить:
ARJ, РКРАК, LHA, ICE, HYPER, ZIP, РАК, ZOO, EXPAND, разработанные за рубежом, а также AIN и RAR, разработанные в России. Обычно упаковка и распаковка файлов выполняются одной и той же программой, но в некоторых случаях это осуществляется разными программами, например, программа PKZIP производит упаковку файлов, a PKUNZIP — распаковку файлов.
Многие программы-архиваторы производят распаковку файлов, выгружая их на диск, но имеются и такие, которые предназначены для создания упакованного исполняемого модуля (программы). В результате такой упаковки создается программный файл с теми же именем и расширением, который при загрузке в оперативную память самораспаковывается и сразу запускается. Вместе с тем возможно и обратное преобразование программного файла в распакованный формат. К числу таких архиваторов относятся программы PKLITE, LZEXE, UNP.
Программа EXPAND, входящая в состав утилит операционной системы MS DOS и оболочки Windows, применяется для распаковки файлов программных продуктов, поставляемых фирмой Microsoft.
Программы-архиваторы RAR и AIN, кроме обычного режима сжатия, имеют режим solid, в котором создаются архивы с повышенной степенью сжатия и особой структурой организации. В таких архивах все файлы сжимаются как один поток данных, т.е. областью поиска повторяющихся последовательностей символов является вся совокупность файлов, загруженных в архив, и поэтому распаковка каждого файла, если он не первый, связана с обработкой других. Архивы такого типа предпочтительнее использовать для архивирования большого числа однотипных файлов,
2.4.1 Программы-архиваторы для MS-DOS
2.4.1.1 Программа- архиватор ARJ
Достоинства: очень большое количество ключей, что дает возможность автоматизировать большое число функций. Защита архива от повреждений.
Недостатки: отсутствие диалогового режима, некоторое неудобства работы при наличии какого-то ключа в переменной окружения (ARJ_SW) и строке запуска - взаимное уничтожение.
Программа ARJ позволяет:
создавать архивные файлы из отдельных или всех файлов текущего каталога и его подкаталогов, загружая в один архив до 32000 файлов;
добавлять и заменять файлы в архиве;
извлекать и удалять файлы из архива;
просматривать содержимое архива;
создавать многотомный архив;
защищать каждый из помещенных в архив файлов 32-битовым циклическим кодом, тестировать архив, проверяя сохранность в нем информации;
получать помощь по работе на 3 международных языках;
вводить в архив комментарии к файлам;
запоминать в архиве пути к файлам;
сохранять в архиве несколько поколений (версий) одного и того же файла;
переупорядочивать архивный файл по размерам файлов, именам, расширениям, дате и времени модификации, коэффициенту сжатия и др.;
осуществлять поиск строк в архивированных файлах;
восстанавливать файлы из разрушенных архивов;
создавать самораспаковывающиеся архивы как на одном томе, так и на нескольких томах;
просматривать содержимое текстовых файлов, содержащихся в архиве;
обеспечивать защиту информации в архиве и доступ к файлам, помещенным в архив, по паролю.
2.4.1.1.1 Структура командной строки для работы с программой ARJ
Для получения на экране краткой помощи по работе достаточно в командной строке ввести имя программы: ARJ.
Для получения развернутой помощи и примеров задания команд следует ввести:
ARJ -? или ARJ /?
Для загрузки программы и выполнения ею необходимых функций используется формат командной строки, где имя программы и параметры разделяются пробелами:
ARJ <команда> [-<кл1> [-<кл2>...]] <имя_архива> [<список_имен_файлов>]
Обязательные параметры командной строки — это два параметра: <команда> и <имя_архива>.
В качестве списка имен файлов можно использовать шаблон (маску).
Параметр <команда> записывается в виде одного символа вслед за именем программы и задает функцию архивации в соответствии с табл. 11.1.
Таблица. Основные команды программы-архиватора ARJ
Номер группы |
Группа команд |
Команда |
Функция архивации |
1 |
Помещение в архив |
а |
Добавить файлы в архив |
|
|
u |
Заменить файлы в архиве на новые версии |
|
|
f |
Добавить в архив только новые файлы |
|
|
m |
Переместить файлы в архив |
2 |
Извлечение из архива |
е |
Извлечь файлы из архива в текущий каталог |
|
|
х |
Извлечь файлы из архива и поместить в каталоги в соответствии с указанными к ним путями доступа |
3 |
Удаление из архива |
d |
Удалить файлы из архива |
4 |
Сервисные функции |
t |
Полное тестирование архива |
|
|
l |
Вывод содержимого архива без указания пути к файлам |
|
|
v |
Вывод содержимого архива с указанием пути к файлам |
|
|
y |
Копировать архив с новыми параметрами |
|
|
w |
Найти текстовую строку в архиве |
Параметр <имя_архива> задает имя архивного файла и записывается по общим правилам MS DOS, но без указания расширения, которое при создании нового файла присваивается автоматически. Имя архива может быть записано с указанием пути к файлу. Архиватор по умолчанию обрабатывает архивные файлы, имеющие расширение .ARJ.
Самораспаковывающийся архивный файл создается с расширением .ЕХЕ. Такой файл содержит в себе программный модуль распаковки, и для извлечения из него файлов не требуется программа ARJ.
Ключи уточняют действие команды архивации, и их может быть несколько. Каждый ключ начинается с символа "-" и может быть помещен в любом месте командной строки после команды. Признаком ключа кроме символа "-" может быть символ "/". В табл. 11.2 приведены наиболее важные ключи настройки.
Примечание. Команды и ключи программы-архиватора ARJ можно вводить в командную строку в любом регистре.
Список имен файлов приводится тогда, когда обработке подлежат не все файлы архива или текущего каталога. При необходимости добавить, извлечь или удалить несколько файлов в командной строке следует записать их полные имена. В списке файлов можно указать до 64 имен файлов. Для сокращения записи имен файлов можно использовать шаблоны в соответствии с правилами MS DOS, например:
Таблица. Наиболее важные ключи настройки программы-архиватора ARJ
Ключ |
Назначение |
-r |
Добавление файлов из текущего каталога и всех вложенных в него подкаталогов с указанием пути к файлам |
-v |
Создание многотомного архивного файла |
-g |
Защита создаваемого архива паролем: g<пароль> — пароль вводится в командной строке; g? — ввод невидимого пароля при выполнении |
-x |
Добавление/замена файлов, за исключением файлов, имена которых указаны вслед за ключом |
-q |
Запрос на выполнение операции для каждого файла: для подтверждения необходимо ввести символ "Y"; для отказа — символ "N" |
-je |
Создание самораспаковывающегося архива |
-m |
Указание метода архивации: m0 — без сжатия; ml — нормальное сжатие (по умолчанию); m2 — наибольшая компрессия; m3 — быстрое сжатие и меньшая компрессия; m4 — самое быстрое сжатие и наименьшая компрессия |
-y |
Предполагается ответ Yes на все вопросы архиватора |
-jp |
Пауза при просмотре содержимого архива после заполнения экрана |
2.4.1.1.2 Помещение файлов в архив
Одной из основных операций при работе с архивными файлами является помещение файлов в архив, которая может выполняться с помощью команд: a, u, m, f. Наиболее часто эти команды применяются совместно с ключами: -r, -g, -q, -je.
2.4.1.1.3 Работа с многотомными архивами
Одним из важных достоинств программы-архиватора ARJ является возможность создания многотомных архивов, т.е. архивов, для размещения которых используется несколько дисков. На каждом из дисков размещается один файл архива, занимая все свободное его пространство. При этом необязательно, чтобы диск предварительно был очищен, так как на нем вместе с архивным файлом могут находиться и другие файлы.
При создании архива файлу, размещаемому на первом диске, по умолчанию присваивается расширение .ARJ, а на последующих дисках — .А01, .А02 и т.д. Правило обозначения расширений можно изменить с помощью ключей настройки, что практически снимает ограничения по количеству томов архива.
Просмотр оглавлений каждого из архивных файлов многотомного архива осуществляется так же, как и однотомного архива.
Программа ARJ позволяет корректировать содержимое многотомного архива — удалять, заменять и добавлять файлы. При этом перераспределение файлов между томами не производится.
Дня работы с многотомным архивом необходимо указывать ключ -v. Уточнение настройки команды достигается использованием модификаторов команды.
2.4.1.2 Программа- архиватор PKZIP
Работает из командной строки. Различные функции по обслуживанию архивов .zip выполняются разными программами:
pkzip - помещение файлов в архив
pkunzip - извлечение файлов из архива
zip2exe - создание самораспаковывающегося архива
pkzipfix - восстановление поврежденного архива.
Изучить справку по работе с архиватором pkzip с помощью команд:
pkzip /h
pkunzip /h
zip2exe /h
2.4.1.3 Программа- архиватор RAR
Архиватор RAR v2.50 для DOS - Интегрированная программа управления архивами.
RAR - это очень мощное средство для создания архивов и управления ими.
Возможности RAR:
Полноэкранный интерактивный интерфейс (отключаемый);
Поддержка мыши и меню;
Поддержка не-RAR архивов;
'Стандартный' интерфейс командной строки;
Оригинальный высокоэффективный алгоритм сжатия данных;
Специальный алгоритм для сжатия мультимедийных файлов;
Лучшая степень упаковки, чем у аналогичных продуктов, за счет использования режима "непрерывного" сжатия;
Информация об авторе архива (только в зарегистрированной версии);
Самораспаковывающиеся (SFX) обычные и многотомные архивы;
Восстановление физически поврежденных архивов;
Язык программирования для инсталляционных SFX-архивов;
Блокировка, шифрование, список порядка файлов, метки томов и др.
2.4.1.6 Прочие программы- архиваторы для MS DOS
Arhangel -- этот архиватор базируется на архиваторе HA, но несовместим с ним. По заявлению создателей этот архиватор наиболее подходит для сжатия изображений (TIFF, BMP).
Достоинства: хорошее сжатие графической информации.
Недостатки: обилие ключей для установки максимального сжатия.
JAR -- новый архиватор из семейства ARJ. Тестирование подтверждает, что этот архиватор лучше WinRAR. Возможности примерно такие же, как и у ARJ.
Достоинства: достаточно быстрая работа, поддержка recovery record -- возможность восстановления сбойных архивов.
Недостатки: нет диалогового режима работы.
HA -- Архиватор, написанный Harry Hirvola в 1993 году. Работает медленно (или даже очень медленно), но, по результатам тестов, хорошо. Особенно хорошо сжимает текстовые файлы: на 20% меньше, чем PKZIP. Недостатки: Малое количество ключей, несколько нестандартные команды. Невозможность создания многотомных архивов и самораспаковывающиеся архивов. Не поддерживает шифрование.
UC II (Ultra compress) -- программа, работающая из командной строки, но имеющая диалоговое меню для настройки различных параметров. Есть возможность добавлять recovery record. Интересная дополнительная программа по шифрованию архивов.
Недостатки: Разбивка на дискеты только фиксированной длинны и только внешней программой...
2.4.2 Архивация данных для Windows
2.4.2.1 Программа- архиватор WinZip
Последняя финальная версия WinZip 8.1
WinZip - наверное, самый популярный архиватор, имеет встроенную поддержку разархивирования .CAB-файлов и файлов популярных "интернет-форматов", таких как TAR, GZip, UUencode, BinHex и MIME. Разархивирование файлов ARJ, LZH и ARC поддерживается через соответствующие архиваторы. WinZip прост и удобен в работе, имеет интуитивно понятный интерфейс, позволяющий даже начинающим пользователям работать с ним без подготовки. К программе можно подключить внешнюю антивирусную программу для проверки файлов архивов на вирусы. Архиватор может работать в двух стилях: Wizard (мастер, помощник) Classic (стандартный, классический). Стиль Wizard - для тех, кто еще не освоился с архиватором или любит работать пошагово, отвечая на соответствующие вопросы программы.
Поддержка перетаскивания файлов в/из архива, а также интеграция с проводником, делают WinZip очень удобным в работе архиватором. По нажатию правой кнопки мыши в проводнике вызывается контекстно-зависимое меню, настраиваемое в опциях. Пункты меню позволяют добавить файлы в архив, создать новый архив, разархивировать файлы из архива, создать самораспаковывающийся архив, заархивировать файлы и отправить по электронной почте, использую установленный по умолчанию почтовый клиент.
Если файл, на котором нажимают кнопку, является ZIP-архивом, то меню в проводнике будет выглядеть так:
По умолчанию WinZip ассоциирует себя со следующими расширениями файлов:
WinZip поддерживает создание многотомных архивов.
К программе можно скачать дополнения:
WinZip Command Line Support Add-On - для работы с архивами из командной строки.
WinZip Internet Browser Support Add-On - для упрощения скачивания архивов из Интернет, их распаковки и инсталляции программ. Архив автоматически скачивается в указанную в настройках директорию и по окончании открывается в WinZip'е.
WinZip Self-Extractor - для создания самораспаковывающихся архивов. WinZip Self-Extractor, хотя и может работать как дополнение к WinZip, является самостоятельным программным продуктом. Начиная с версии 8.0 в WinZip для создания самораспаковывающихся архивов встроен WinZip Self-Extractor Personal Edition с несколько ограниченными, по сравнению с WinZip Self-Extractor возможностями.
2.4.2.2 Программа- архиватор WinRAR
Наверное, второй по популярности архиватор после WinZip, а в России наверняка даже его опережает. Последняя финальная версия - WinRAR 2.90
WinRAR работает в Windows 9x/ME/NT/2000/XP. Существует консольная версия Rar, а также версии для Linux, BeOS, DOS, OS/2 и различных платформ Unix. WinRAR доступен на многих языках, в том числе на русском. Автор программы - Евгений Рошал из Челябинска.
В программе реализован оригинальный алгоритм компрессии, позволяющий хорошо сжимать файлы, особенно выполняемые, библиотеки и большие текстовые файлы, а также специальный алгоритм для сжатия мультимедиа-файлов.
Полностью поддерживается формат ZIP, а также основные операции (просмотр содержимого, распаковка, показ комментариев и информации об архивах) для файлов CAB, ARJ, LZH, TAR, GZ, ACE, UUE, BZ2 и JAR.
Поддерживается возможность создания непрерывных (solid) архивов, с увеличением степени сжатия на 10-50%, особенно для большого количества файлов; создания многотомных и самораспаковывающихся архивов. WinRAR интегрируется в проводник, при нажатии правой кнопкой мыши на поддерживаемом типе архива возникает контекстное меню:
А при выделении других файлов (и директорий) - меню для добавления файлов в архив (для запуска WinRAR и уточнения параметров) и меню для создания из выбранных файлов и директорий архива RAR.
WinRAR также позволяет защищать архивы от повреждений, путем сохранения избыточной информации, закрывать архивы от изменений, архивировать с паролем, а также добавлять в архивы комментарий (с поддержкой ESC-последовательностей ANSI) и запись о создателе (только для зарегистрированных пользователей).
2.4.2.3 Программа- архиватор PowerArchiver 2001
Последняя версия - PowerArchiver 2001 7.02.08
Встроенная полная поддержка файлов ZIP, CAB, LHA (LZH), TAR, TAR.GZ, TAR.BZ2 и BH (BlakHole), а также XXE и UUE файлов. Встроенная поддержка для разархивации файлов RAR, ARJ, ARC, ACE, ZOO, GZ и BZIP2. Встроенное внутреннее средство просмотра файлов TXT, RTF, BMP, ICO, WMF, EMF, GIF и JPG. Возможность печати списка файлов в архиве или экспорта списка в файлы формата TXT или HTML. Поддержка перетаскивания файлов в/из архивов. Имеются возможности по выполнению резервного копирования, возможность разархивации сразу нескольких архивов, починка поврежденного архива (только для ZIP), создание многотомного ZIP-архива из целого архива и наоборот, встроенная функция определения типа архива. Возможность подключения внешнего антивируса. Две модели просмотра архивов - классическая и по типу проводника, с двумя разделенными горизонтально окошками и показом древовидной структуры. По количеству встроенных возможностей программа опережает своих конкурентов, за счет чего она довольно быстро завоевала популярность среди пользователей.
Интеграция в проводник с настраиваемым меню:
На архивных файлах всплывающее по нажатию правой кнопки мыши меню выглядит следующим образом.
А такой вид оно имеет при нажатии и выделении на файлах других форматов.
Дополнения к программе:
Поддержка параметров командной строки - PowerArchiver Command Line Support Add-On или PowerArchiver Command Line.
Для создания самораспаковывающихся архивов - PowerArchiver SFX Maker Add-On.
2.4.2.4 Программа- архиватор WinAce
На данный момент последней является версия WinAce 2.11
Архивация в следующие форматы: ACE, ZIP, LHA, MS-CAB, JAVA JAR.
Разархивация форматов ACE, ZIP, LHA, MS-CAB, RAR, ARC, ARJ, GZip, TAR, ZOO, JAR. Поддержка многотомных архивов для файлов форматов ACE, ZIP, CAB. Создание самораспаковывающихся архивов, а также восстановление архивов для файлов ACE и ZIP. Доступ из командной строки. Встроенное средство просмотра документов Word, HTML, текстовых файлов и основных графических форматов: TIFF (*.tif; *.tiff), Photoshop (*.psd, *.pdd), Paintshop Pro (*.psp), *.png (Portable network graphic), GIF, BMP, Standard Windows bitmap (*.bmp, *.rle, *.dib), *.ico, SGI (*.bw, *.rgb, *.rgba, *.sgi), Autodesk (*.cel; *.pic), Truevision (*.tga; *.vst; *.icb; *.vda; *.win), ZSoft Paintbrush (*.pcx, *.pcc), копии экрана Word 5.x (*.scr), Kodak Photo-CD (*.pcd), Portable pixel/gray map (*.ppm, *.pgm, *.pbm), Dr. Halo (*.cut, *.pal), SGI Wavefront (*.rla, *.rpf) и GFI факс (*.fax). Функция оптимизации существующих архивов. Интеграция с проводником: наличие всплывающих контекстных меню по нажатию правой кнопки мыши и дополнительная закладка при просмотре свойств файлов (только для архивов ACE и ZIP).
Формат ACE часто используется при обменами файлов на ряде каналов IRC-серверов.
2.4.2.5 Программа- архиватор 7-Zip
Последняя доступная на данный момент версия – 7-Zip 2.30 Beta 12.
Это сравнительно мало известный архиватор, обеспечивающий довольно высокую степень сжатия для формата ZIP и имеющий также свой формат 7z с высокой степенью сжатия. Ко всему прочему, 7-Zip является бесплатным. Архиватор полностью поддерживает форматы ZIP, GZIP, BZIP2, TAR, 7z, обеспечивает разархивацию файлов формата RAR, CAB. Возможна работа из командной строки. Интегрируется в проводник, добавляя простое меню из трех пунктов:
2.4.2.6 Сравнение функциональных возможностей
Поддержка форматов и другие возможности
Формат, функция |
WinZIP 8.1 |
WinRAR 2.90 |
PowerArchiver 2001 7.02.08 |
WinAce Archiver 2.04 |
7-Zip 2.30 Beta 12 |
ZIP |
Полная |
Полная |
Полная |
Полная |
Полная |
RAR |
Нет |
Полная |
Распаковка |
Распаковка |
Распаковка |
ACE |
Нет |
Распаковка |
Распаковка |
Полная |
Нет |
Другие |
XXe, BinHex, MIME |
- |
XXE |
- |
7z |
Поддержка многотомных архивов |
ZIP |
RAR |
ZIP |
ACE, ZIP, CAB |
Нет |
Поддержка создания Solid архивов |
Нет |
RAR |
Нет |
ACE |
7z |
Встроенная |
Windows |
Windows и DOS |
Windows |
Windows и DOS |
Windows |
Поддержка внешнего антивируса |
Да |
Нет |
Да |
Да |
Нет |
Поддержка работы в командной строке |
через WinZip Command Line Support Add-On |
Полная |
Основные операции. Полная - через PowerArchiver Command Line Support Add-On |
Полная |
Полная |
Поддержка комментариев в архивах |
ASCII для ZIP |
ASCII и ANSI для RAR и ZIP |
ASCII для ZIP |
ASCII, ANSI и HTML |
Нет |
2.4.3 Сравнение версий архиваторов MS DOS и Windows.
Несмотря на кажущуюся «моральную отсталость» MS DOS, в ряде случаев использование MSDOS-архиваторов может быть гораздо более эффективным, по сравнению с аналогичными версиями для Windows 9x.
Архиваторы работающие в среде MSDOS работают в реальном режиме процессора. Это обеспечивает не менее чем в 1.5 раза большую производительность процессора, по сравнению с защищенным режимом Windows 9x (для процессоров P-II и старше).
Все версии архиваторов для MS DOS ( по крайней мере из рассмотренных выше), весьма эффективно используют память XMS или EMS. С учетом реального режима работы процессора, это дает еще 10-15 % выигрыша в производительности.
Как ни странно, версии архиваторов для MS DOS часто используют более совершенные алгоритмы сжатия. Причина проста - в большинстве случаев в версиях архиваторов для MS DOS опробуются возможные усовершенствования, переносимые далее в Windows. Причем, иногда применение некоторых новшеств в Windows оказывается технически нецелесообразным. Пример: из-за переполнения кэш-памяти современных процессоров Pentium-II или Celeron - отказ от применения в архиваторе WinZip 8.0 Beta словаря переменной длинны (более 128 кбайт).
Резюмируя, можно утверждать, что при прочих равных условиях (тип вычислительной системы, степень сжатия и др.) производительность архивации (особенно упаковки с высокой степенью сжатия) в архиваторах для MS DOS примерно в 1.5-1.6 выше. Грубо говоря, в 1.5 раза быстрее. Для небольших архивов (до 40-100MB) это не является существенным. Однако если выполнять архивирование 10000-15000 файлов общим объемом более 1-2Гб (типичный объем небольшого FTP сервера INTERNET), разница во времени может составить до 30-60 минут (Celeron-450MHz + 64MB RAM).
И наконец, в случае повреждения загрузочных файлов Windows 9x , единственным способом «спасти» архив, является использование проверенных и надежных архиваторов для MS DOS.
2.5 Дополнительные возможности архиваторов
Кроме файла специального типа в большинстве современных архиваторов создается и саморазворачивающихся архив в виде EXE-файла, запуск которого приводит к распаковке архива. Для оформления такого архива в WinZIP 2.6 требуется выбрать "Make .EXE file" в меню "Actions". Применение саморазворачивающегося архива упрощает работу. Но если к вам попал EXE-файл сомнительного происхождения, предположительно саморазворачивающегося архива и если такой файл на самом деле является программой, зараженной вирусом, то при его запуске могут быть непредсказуемые последствия. Поэтому эти файлы лучше все-таки распаковывать при помощи архиватора. Вообще, из соображений безопасности лучше полностью отказаться от саморазворачивающихся архивов.
Некоторые архиваторы, например соответствующая утилита, встроенная в Norton Commander, организуют разбивку получающегося архива на несколько файлов с длиной, равной емкости дискеты, что позволяет использовать архиватор для быстрого и удобного резервного копирования. Однако если повредить информацию на одной из дискет, то невозможно будет провести распаковку всего архива. Поэтому с точки зрения надежности лучше создавать для каждой дискеты независимый архив.
Информацию в архиве можно защитить паролем и просмотреть список находящихся в нем файлов, но при этом нельзя будет производить над ними операции. Распаковка защищенного архива возможна только при вводе правильного пароля. При коммерческом распространении программ через Internet защита архива паролем широко используется. Можно бесплатно скачать архивированные файлы программы, но пароль для их распаковки вы получите тогда, когда оплатите покупку программы. По сравнению со специальными утилитами шифрования архиваторы слабо обеспечивают защиту информации от взлома, но вместе с тем в большинстве случаев предоставляемых архиватором возможностей оказывается вполне достаточно.
Современной тенденцией в развитии архиваторов является введение в них дополнительных сервисных возможностей, непосредственно не связанных с процессами сжатия и распаковки информации. Но они автоматизируют операции после работы архиватора. Так, к архиватору можно подключить внешнюю антивирусную программу, и тогда распаковываемые архивы автоматически будут проверяться на наличие вирусов. Некоторые программы электронной почты требуют предварительной специальной обработки присоединяемого файла. Архиватор может автоматически осуществлять такую обработку создаваемого архива.
3. Протокол диалога пользователя с ЭВМ
Задание |
Набираемые пользователем команды и реакция системы. |
||
1. Перейдите в командную строку MS DOS.
|
C:\>_ |
||
2. На диске D: в каталоге ПрМат создайте именной каталог.
|
С:\ IEIS\PRMAT >md Olya |
||
3. Скопируйте в созданный каталог несколько файлов с расширениями *.txt, *.doc, *.jpeg, *.bmp.
|
С:\ IEIS\PRMAT\ Olya >copy С:\IEIS\PRMAT\F4.TXT С:\ PRMAT\Olya С:\IEIS\ PRMAT\ Olya >copy С:\IEIS\PRMAT\F4.DOC С:\ PRMAT\Olya С:\ IEIS\PRMAT\ Olya >copy С:\IEIS\PRMAT\F4.JPEG С:\ PRMAT\Olya >copy С:\IEIS\PRMAT\F4.BMP С:\ PRMAT\Olya |
||
4. Поместите файлы в архивы (отдельно *.txt, *.doc, *.jpeg, *.bmp ), используя форматы команд программ – архиваторов Arj и PKZip |
Arj режим имя - архива [каталог \ имена файлов];
|
С:\ IEIS\PRMAT\ Olya\>arj a archtxt *.txt С:\ IEIS\PRMAT\ Olya\>arj a archdoc *.doc С:\ IEIS\PRMAT\ Olya\>arj a archj *.jpeg С:\ IEIS\PRMAT\ Olya\>arj a archb *.bmp |
|
PKZip команда режим имя - архива [каталог \ имена файлов]; -В обычном режиме -В режиме максимального сжатия.
|
С:\ IEIS\PRMAT\ Olya\> pkzip archtxt *.txt С:\ IEIS\PRMAT\ Olya\>pkzip archdoc*.doc С:\ IEIS\PRMAT\ Olya\> pkzip archj *.jpeg С:\ IEIS\PRMAT\ Olya\> pkzip archb *.bmp С:\ IEIS\PRMAT\ Olya\> pkzip archtxt *.txt С:\ IEIS\PRMAT\ Olya\>pkzip -es archdoc*.doc С:\ IEIS\PRMAT\ Olya\> pkzip -es archj *.jpeg С:\ IEIS\PRMAT\ Olya\> pkzip -es archb *.bmp
|
||
ICE команда имя - архива [каталог \ имена файлов]; |
С:\ IEIS\PRMAT\ Olya\>ice a archtxt *.txt С:\ IEIS\PRMAT\ Olya\> ice a archdoc *.doc С:\ IEIS\PRMAT\ Olya\> ice a archj *.jpeg С:\ IEIS\PRMAT\ Olya\> ice a archb *.bmp |
||
5. Проведите проверку целостности архивов.
|
С:\ IEIS\PRMAT\ Olya\>arj t archtxt Processing archive: ARCHTXT.ARJ Archive created: 2004-02-23 13:33:54, modified: 2004-02-23 13:33:54 Testing 4.TXT OK Testing 5.TXT OK 2 file(s) С:\ IEIS\PRMAT\ Olya\>arj t archdoc Processing archive: ARCHDOC.ARJ Archive created: 2004-02-23 13:37:10, modified: 2004-02-23 13:37:10 Testing 3.DOC OK 1 file(s) С:\ IEIS\PRMAT\ Olya\>arj t archj Processing archive: ARCHJ.ARJ Archive created: 2004-02-23 13:38:02, modified: 2004-02-23 13:38:02 Testing 6A282~1.JPE OK Testing 7A682~1.JPE OK 2 file(s) С:\ IEIS\PRMAT\ Olya\>arj t archb Processing archive: ARCHB.ARJ Testing 1.BMP OK Testing 2.BMP OK 2 file(s)
|
||
6. Просмотрите оглавление архивов, оцените степень сжатия, полученную в результате архивации файлов *.txt?, *.doc, *.jpeg, *.bmp.
|
С:\ IEIS\PRMAT\ Olya\>arj v archtxt |
||
001)4.TXT 002) 5.TXT 2 files |
Original 59813 3815 63628 |
Compressed 17283 1865 19148 |
Ratio 0.289 0.489 0.301 |
С:\ IEIS\PRMAT\ Olya\>arj v archdoc |
|||
3.doc 1 files |
88064 88064 |
34839 34839 |
0.396 0.396 |
С:\ IEIS\PRMAT\ Olya\>arj v archj |
|||
001)6A282~1.JPE 002)7A682~1.JPE 2 files |
32498 15954 48452 |
32498 15861 48359 |
1.000 0.994 0.998 |
С:\ IEIS\PRMAT\ Olya\>arj v archb |
|||
001) 1.BMP 002) 2.BMP 2 files |
2335294 1692678 4027972 |
37875 29795 67670 |
0.016 0.018 0.017 |
7. Переместите файлы из архива во вновь созданный каталог D:\ПрМат1. |
С:\ IEIS\PRMAT\ Olya\>cd c:\ieis\ C:\IEIS\>md PRMAT1 С:\ IEIS\PRMAT \ Olya\>arj e archtxt С:\ IEIS\PRMAT1\ С:\ IEIS\PRMAT \ Olya\>arj e archdoc С:\ IEIS\PRMAT1\ С:\ IEIS\PRMAT \ Olya\>arj e archj С:\ IEIS\PRMAT1\ С:\ IEIS\PRMAT \ Olya\>arj e archb С:\ IEIS\PRMAT1\
|
||
8. Повторите выполнение п.п.4-8 , используя программы – архиваторы WinRar, WinZip используя различные методы сжатия (store, fartest, fast, normal, good, best).
|
|
||
9. Добавьте комментарии к архивам.
|
Инфо – Комментарий – (команды - добавить комментарий) |
||
Actions-comment |
|||
10. Протестируйте целостность архивов. |
Тест (команды - протестировать файлы в архиве) |
||
Actions-test |
|||
11. Преобразуйте архивы в самораспаковывающиеся архивные файлы.
|
команды - преобразовать архив в SFX |
||
Actions-Make exe file |
|||
12. Сведите полученные результаты в сводную таблицу.
|
|
Файлы с расширением Архиватор
|
txt 63628 |
doc 88064 |
jpeg 48452 |
bmp 4027972 |
|
Соотношение |
|||||
ARJ |
0.301 |
0.396 |
0.998 |
0.017 |
|
PKZip |
В обычном режиме |
0,3 |
0,4 |
1 |
0,016 |
В режиме shrink |
0,4 |
0,44 |
1 |
0,02 |
|
ICE
|
0,34 |
0,14 |
1 |
0,03 |
|
RAR |
normal |
0,51 |
0,40 |
0,9 |
0,018 |
WinRAR |
без сжатия |
1 |
1 |
1 |
1 |
скоростной |
0,29 |
0,396 |
0,9998 |
0.0158 |
|
быстрый |
0,285 |
0,394 |
0,9998 |
0.0157 |
|
обычный |
0,28 |
0,37 |
0,9997 |
0.0177 |
|
хороший |
0,23 |
0,346 |
0,9997 |
0.0175 |
|
максимальный |
0,225 |
0,345 |
0,9997 |
0.0174 |
|
WinZIP |
maximum |
0,29 |
0,40 |
1 |
0,016 |
normal |
0,3 |
0,41 |
1 |
0,0175 |
|
fast |
0,33 |
0,42 |
1 |
0,02 |
|
super fast |
0,355 |
0,43 |
1 |
0,022 |
|
none |
1 |
1 |
1 |
1 |
Вывод: В ходе лабораторной работы я изучила основные виды программ-архиваторов, алгоритмов архивации данных, приобрела практических навыков их использования. Я приобрела практические навыки использования программ-архиваторов ARJ,RAR,PKZip,WinZip,WinRar . Я архивировала файлы с расширениями txt,doc,bmp,. Из представленной таблицы видно, что хуже всего сжимаются файлы с расширением jpeg и лучше всего это делает архиватор RAR. RAR обеспечивает максимальную по сравнению с другими архиваторами степень сжатия.