Вход

Методы экономии времени поиска релевантного документа

Реферат по информатике и информационным технологиям
Дата добавления: 12 сентября 2007
Язык реферата: Русский
Word, rtf, 104 кб
Реферат можно скачать бесплатно
Скачать



Реферат по лекциям АСОД


Методы экономии времени поиска релевантного документа.

(Релевантный документ- искомый документ, время поиска- величина случайная.)

  1. Поставить книги правильно, вертикально, корешком к лицу.

  2. Ознакомление с содержанием

  3. Наиболее эффективным методом экономии времени релевантного документа является метод распределения документов по группам родственной тематики.

Группа документов объединяемая общим признаком называется классовым документом. Класс документов- это двух частная структура, состоящая из названий классов.


Название веществ. состав

класса






Класс документов




Количество времени ознакомления на кол-во просмотров = время поисков.

Время поиска производится 1 ступенью поиска. На Третей ступени искомые документы. Время поиска уменьшается за счет уменьшения сплошного просмотра.


На 1 ступени название класса разыскивается сплошным перебором, если не приняты меры по упорядоченному названию. Для ускорения поиска на 1 ступени, назв. Класса нужно расположить по алфавиту названия. (А, Б, В, Г, Д… )

Алгоритм поиска:

1.Поиск названия классов по алфавиту.

2.Переход от названия классов к вещественной части.

3.Поиск искомых документов в вещественных частях релевантного документного класса.

Формула:

Tпоиска = Т док. Классификация + Т упорядочивание классов по назв. +Т по. Назв.классов +Т поиска док.

( Т-время)

Создание классификационной коллекция оправдана, только в том случае если предполагается большое число обращений к данной коллекции.



математика медицина физика


I) Количество классов остается фиксированное, но происходит приток новых поступлений (вещественная часть классов будет расти, большая вероятность, что Т поиска будет увеличиваться.

Когда кол-во документов классов возрастет до некоторой величины, придется создавать в классах классы.


механика



оптика




электрич.


  1. Поиск производится по сл. алгоритму, в ответ на поисковый запрос, произ. Названия класса на 1 ступени ( По алфавиту)

При создании классов 2 ступени алфавит нарушается.

III) Третья поисковая. Количество классов фиксировано и происходит приток новых поступлений. Будут расти вещественные части подклассов.

Алгоритм поиска:

  1. поиск названий по 1 ступени

  2. поиск названий по 2 ступени

  3. фиксировано количество классов.

Класс документов в котором назв. Классов выражено с помощью предметного слова (математика, физика) назв. Предметным классом документов.


Первые документы создаваемые человеком были док. Хоз. Содержания, в которых учитывалось: земля, скот, хозяйственная утварь.

На ранних этапах накопления документа созд. Предметные классы.

Предметные класс имеют существенный недостаток, алфавит названия классов становится препятствием. Способность классификации поддерживать порядок в назв. Классов называется её поисковой мощностью.

Способность классификации применяется в небольших массивах документов.

Проблемы, которые выявляют анализ начала классификации:

1.Почему человек сохраняет документ?

Проблема хранения неизвестна.

2.Проблема носителя (на каких носителях возникли первые предметы письменности?)


Классы в которых названия документов выражены с помощью предметного слова- называются предметом класса.

Ответ на вопрос о чем данная книга- Суть предмета документа.

Предмет документы выраженный с помощью предметного слова, называется предметной рубрикой. Само предметное слово является смысловым признаком документа. Если документы прибывают, то нужно создавать подклассы.


Систематические классы документов.








Создаются нумерные классы, пример:


С помощью цифр называемыми индексами восстанавливается порядок в назв. Классов (алфавит потерян).





Классификационная рубрика- двухчастная структура состоит из индексов или словесной формулировки.

Прямая- индеек на 1 месте, а на 2 формулировка. Если наоборот (1 форма; 2 индекс) то обратная классификационная рубрика.

Класс документов в котором назв. Классом выражено с помощью классификационной рубрики наз. Сист. Классов документов.

А сам процесс создания называется систематизация.

Систематические классы документов имеют практическую неограниченную способность поддержания название классов.

Сист. Классы документов имеют практически неограниченную способность поддержания названия классов.

Предметные классы документов можно применять на массивах незначительных по объему.









Алфавитно-предметный указатель фондов предст. Собой перечень строк классификационных рубрик в обратном порядке. 1. формулировка 2.индекс.

Бурение 14

Взрывное дело 133

Горное дело 33

Крепление гор. Выроб. 141.


  1. Алгоритм поиска в этой системе с помощью апуф.

  2. Переход по словестному индексу.

  3. По индексу апуф в системе разыскивается релевантный класс документов.

  4. Релевантный документ разыскивается сплошным просмотром.




Классифицированная коллекция обл. является существенным недостатком, она выводит документ не на релевантный документ, а на релевантный класс. Для того чтобы уменьшить сплошной поиск (с помощью апуф) вводиться портрет документа (на каждый документ)

Например: бурение 13

взрывные работы

Что представляет собой портрет документа?

Это могут быть фото снимки документа. Портрет документа позволяет вывести потребителя точно на документ. В информационной практике применяются не фото-снимки, а библиотечное описание (БО)

БО имеют недостатки (бывают «говорящие», а есть «мутные») бывают понятные и не говорящие.

БО может сократить сплошной просмотр в релевантном классе, однако это не всегда выведет потребителя на релевантный документ.

Преобразованная строка предметного указателя.




БЗ является элементом любого каталога.

БО бывает расплывчиво по содержанию, поэтому были придуманы другие средства, которые позволяли раскрывать содержания документа на небольшом пространстве - библ. карточке.

Аннотация дает возможность познакомиться с содержанием документа не вызывая необходимости прочитать весь документ поскольку в ней основной сод. Документа изложена.

Она имеет существенный недостаток- она многословна. Для этого было изобретены ключевые слова (это особенность аннотации), но есть и недостаток- они краткие (5-6 строк словосочетаний)





АСОД- комплекс процедур, результатом воплощения которого является БЗ.

В этот комплекс входит:

1.сост. БО.

2.систематизация документа.

3.предметизация.

4.аннотация.

5.выбор ключевых слов (индексирован).


-В чем суть инф. Документальной деятельности?

Человек выступает к документу в двух отношениях:

1.как пользователь документа.

2.как лицо, осуществившее поиск нужного документа при определенных условиях.

Проблема поиска документа возникает в связи действия ряда факторов; важнейшим фактором является:

  1. Количество документа в поисковых массивах.

  2. Количество пользователей документами.

  3. Смена носителя инф. текстового носителя.

Unit-tearms- cлова из текста, текст со стороны содержания.

Key words- «ударные слова».

1945 появление первых компьютеров (массивные)

Первые автоматические устройства в инф. деле применялись ещё до войны. Попытки использования ЭВМ, инф. машин приходится на начало 60ых годов.

Первой направление компьютеров в инф. деле связано с реферативными технологиями.

В СССР в 1952году основан Всесоюзный институт научн. Техн. Информации (ВИНИТИ)

В ВИНИТИ издаются реферативные журналы.

1967год- второе направление информатизации (ГПНТБ).

Для того, чтобы использовать ЭВМ в информационном деле- нужно ввести БЗ в ЭВМ.

Библиотечная запись (БЗ) – библ. описание + другие сведения добавляемые к описанию по мере необходимости, также как:

1.анотация

2.предметная рубрика

3.классификационные индексы.

4.инфор. хранения.

5.инвентарные номера.






Классы документов.

Классы документов- это двух частная структура в которой имеется вещественная часть и словестная группировка использ. Для названия классов.

Названия классов может быть предметной рубрикой, тогда обр. класс является классом документов, название КЛАСС может быть выражено классификационной рубрикой. Название классов выражено формальной рубрикой (атор)

Шифр хранения- адрес документа на полке.

Каталожный индекс- адрес каталожной карточки в каталоге.

Поскольку книга может осуществлять несколько предметом, его содержание может скрываться несколькими классификационными рубриками. Поэтому на каждый документ будет заведено столько записей, сколько в полном индексе отражены все предметы данного документа.













Объединяющий признак - буква русского алфавита.

Классы БЗ могут быть формальные или предметные.

Предметные - если названия класса опр. с помощью предметного слова.

Систематические- если название классов выражено с помощью классификационных рубрик.

Класс БЗ – отдел каталога.

Любой каталог - упорядоченный перечень классов БЗ.
















Классы рубрик.

Классов рубрик называется двухчастная структура в которой вещественная часть набор рубрик объединенных включающей рубрикой выражено с помощью рубрики.

Внутри этого класса можно выделить другие классы, например: «бурение», но по отношению к «горному делу» это будет подкласс. Если название класса выражено с помощью форм. рубрики, то образуется. формальный класс.

Рубрика «Взрыные работы» не имеет вещественной части, но она могла бы образовать класс рубрик (выраженный класс).

В процессе революции инф.-док. деятельности естественным образом возникли классы 3 видов:

1. документные.

2.БЗ

3.рубрик.

Эти классы взаимосвязаны между собой, они функционируют, поддерживая один другой. Они существуют как система.

Советская ББК.

ВВС

UDC

СББК

ТБК

Основные осн. ряда делений:











Для обоснованности основного ряда делений сост. ББК брал за основу «действительность» (объект).

Действительность- объект и субъект, но на картинке они различаются (условно).

Общий отдел: естественные науки

Техника и медицина

с/х; л/х

общий цикл.

Гуманитарный цикл

Основные деления - это названия абсолютно включенных классов.




















© Рефератбанк, 2002 - 2017