Аннотация.
Во введение сформулированы задачи, решаемые в выпускной работе. Далее дано описание цели, задачи документооборота и структура организации.
Вторая глава состоит в разработке бизнес–процессов, которые непосредственно связаны с работой Управления Информатизации, а также рассмотрение документов, которыми пользуется этот отдел.
Следующая глава, концептуальное моделирование, где разработана структуризация факторов системы (иерархия доменов и атрибутов) в виде дерева.
Глава информационное моделирование, является следующим основным этапом в данном курсовом проекте. Здесь проведены анализ и описание связей между отношениями.
В главе модели состояний (жизненных циклов) разработаны диаграмма и таблица переходов для жизненных циклов системы.
Следующая глава математическое моделирование, где дано описание алгоритма обработки информации и формирование состава операций по каждому состоянию.
Программирование, в данном разделе описывается программа, реализующая изложенные алгоритмы.
Иллюстрация программных единиц.
В заключении кратко излагаются результаты курсовой работы.
Курсовой проект содержит 46 страниц текста, 4 рисунка, 6 приложения. Список литературы содержит 6 наименований.
Содержание.
Введение…………………………………………………………....3
Глоссарий…………………………………………………………..6
Глава 1. Организация делопроизводства в деятельности хозяйствующих субъектов……………………………………….13
Замысел и цели разработки системы………………………13
Общие требования и задачи, решаемые системами документооборота…………...……………………………...14
Структурная организация Управления Информатизации..17
Документирование управленческой деятельности………..19
Глава 2. Концептуальное и информационное моделирование….24
Выявление и моделирование бизнес – процессов…………...24
Концептуальное моделирование…………………………….26
Информационное моделирование…………………………...28
Определение жизненного цикла модели…………………….31
Глава 3. Математическое моделирование…………………….34
Проблема поиска и индексирования документов………….34
Векторная и линейная модель индексирования и поиска документов…………………………………………………..37
Коррекция запросов по релевантности……………………39
Глава 4. Программирование……………………………………43
Заключение………………………………………………………..44
Литература………………………………………………………...45
Приложения……………………………………………………….46
Введение.
Целью данной выпускной работы является анализ и разработка системы автоматизации документооборота для предприятия работающего в сфере информационных услуг.
Задача накопления, обработки и распространения (обмена) информации стояла перед человечеством на всех этапах его развития. В течение долгого времени основными инструментами для ее решения были мозг, язык и слух человека. Первое кардинальное изменение произошло с приходом письменности, а затем изобретением книгопечатания. Поскольку в эпоху книгопечатания основным носителем информации стала бумага, то технологию накопления и распространения информации естественно называть “бумажной информатикой”.
Положение в корне изменилось с появлением электронных вычислительных машин (ЭВМ). Первые ЭВМ использовались как большие автоматические арифмометры. Принципиально новый шаг был совершен, когда от применения ЭВМ для решения отдельных задач перешли к их использованию для комплексной автоматизации тех или иных законченных участков деятельности человека по переработке информации.
Одним из первых примеров подобного системного применения ЭВМ в мировой практике были так называемые административные системы обработки данных: автоматизация банковских операций, бухгалтерского учета, резервирования и оформления билетов и т.п. Решающее значение для эффективности систем подобного рода имеет то обстоятельство, что они опираются на автоматизированные информационные базы. Это означает, что в памяти ЭВМ постоянно сохраняется информация, нужная для решения тех задач, на которые рассчитана система. Она и составляет содержимое информационной базы соответствующей системы.
При решении очередной задачи система нуждается во вводе только небольшой порции дополнительной информации, остальное берется из информационной базы. Каждая порция вновь вводимой информации изменяет информационную базу системы. Эта база (информационная, или база данных) находится, таким образом, в состоянии непрерывного обновления, отражая все изменения, происходящие в реальном объекте, с которым имеет дело система.
Хранение информации в памяти ЭВМ придает этой информации принципиально новое качество динамичности, т.е. способности к быстрой перестройке и непосредственному ее использованию в решаемых на ЭВМ задачах. Устройства автоматической печати, которыми снабжены современные ЭВМ, позволяют в случае необходимости быстро представить любую выборку из этой информации в форме представления на бумаге.
По мере своего дальнейшего развития административные системы обработки данных перерастают в автоматизированные системы управления соответствующими объектами, в которых, как правило, не ограничиваются одной ЭВМ, а в составе двух и более ЭВМ объединяют в вычислительный комплекс.
В этом ряду особое место занимают базы данных и другое программное обеспечение, связанное с их использованием в качестве инструмента для делопроизводства и рационализации труда. Их использование позволяет сократить время, требуемое на подготовку конкретных маркетинговых и производственных проектов, уменьшить непроизводительные затраты при их реализации, исключить возможность появления ошибок в подготовке бухгалтерской, технологической и других видов документации, что дает для предприятия прямой экономический эффект.
Разумеется, для раскрытия всех потенциальных возможностей, которые несет в себе использование баз данных, необходимо применять в работе комплекс программных и аппаратных средств максимально соответствующий поставленным задачам. Поэтому в настоящее время велика потребность предприятий в компьютерных программах, поддерживающих и согласующих работу управленческого и финансового звеньев компании, а также в информации о способах оптимального использования имеющегося у компании компьютерного оборудования.
Дерево целей «Автоматизированная система документооборота»
Рис. 1. Дерево целей «Автоматизированная система документооборота»
Глоссарий.
А
Автоматизированная система управления (АСУ) – это человекомашинная система, в которой с помощью технических средств обеспечивается сбор, накопление, обработка информации, формулирование оптимальной стратегии управления определенными компонентами и выдача результатов человеку или группе людей, принимающих решение по управлению.
Анализ - выявление соответствующих факторов и оценка их значимости.
Атрибут - это абстракция одной характеристики, которыми обладают все абстрагированные как объект сущности.
Акт - документ, составленный несколькими лицами и подтверждающий установленные факты и события.
Б
Бизнес-процесс - обеспечивает реализацию всех видов деятельности, связанных с производством товаров или услуг; определяет функциональные и информационные связи между различными объектами.
Бизнес-правила - последовательность выполняемых работ.
В
Взаимодействие - объекты получаемые из отношений с другими объектами. Например, контракт, платежная ведомость, налог с оборота, главная книга и т.п.
Вспомогательные атрибуты - используются для связи экземпляра одного объекта с экземпляром другого. Описание атрибута для вспомогательного атрибута должно указывать на реальное отношение, сберегаемое атрибутом.
Д
Докладная записка – документ, адресованный руководителю донного или вышестоящего учреждения, содержащий обстоятельное изложение какого-либо вопроса с выводами и предложениями составителя.
Договор – документ, фиксирующий соглашение сторон об установлении каких-либо отношений и регулирующий эти отношения.
Доклад – документ, содержащий изложение определенных вопросов, выводов, предложений и предназначенный для устного прочтения.
Ж
Жизненным циклом проекта (иногда говорят – проектным циклом) – называется промежуток времени между моментом появления проекта и моментом его ликвидации.
З
Заключение – документ, содержащий мнение, вывод учреждения, комиссии, специалиста по какому-либо документу или вопросу.
Заказ на размножение – содержит просьбу о воспроизведении или размножении документов каким-либо способом.
И
Инциденты – абстракция чего-то произошедшего или случившегося. Например: перечисление в банк, проводка, выдача зарплаты, срочные платежи, поставка продукции.
Интерфейс -это взаимодействие между системой и средой между двумя системами или двумя компонентами системы.
Информационная модель - это модель, где каждому объекту должно быть назначено уникальное имя. При этом должно явно указываться отношение объекта или к классу объектов, или экземпляру.
Инструкция – правовой акт, издаваемый органом государственного управления в целях установления правил, регулирующих организационные, научно-технические, технологические, финансовые и иные специальные стороны деятельности учреждений, организаций, должностных лиц и граждан.
Извещение и заседании, собрании и конференции – документ, информирующий о предстоящем мероприятии и предлагающий принять в нем участие.
К
Классификация - операция отнесения заданного объекта к одному из классов, внутри которых объекты считаются неразличимыми.
Контроль - определяет, достигли ли характеристики организации поставленных целей.
Коммуникационные системы - это комплекс технических, программных и других средств, а также стандартов и договоренностей для создания передачи и приемы электронных сообщений
Компоненты - это части, элементы или узлы, составляющие систему.
Контракт – соглашение двух или более лиц об установлении, изменении или прекращения прав и обязанностей.
Л
Личная карточка – документ, служащий для анализа состава и учета движения кадров.
М
Матричная структура – создается на базе функциональной структуры, отношения в которой базируются на прямых вертикальных связях руководства – подчинения.
Матричный бюджет – это ресурсы, выделяемые руководителю проекта по выполнению услуг, оказываемых функциональными подразделениями при выполнении проекта.
Модель – любая совокупность (абстрактных) объектов, свойства которых и отношения между которыми удовлетворяют данными аксиомами, служащим тем самым совместным (неявным) определением такой совокупности.
О
Объект-спецификация – используется для представления правил, нормативных документов или критериев качества, стандартов.
Описательные атрибуты - представляют факты присущие каждому экземпляру объекта. Описание атрибута должно устанавливать реальную характеристику или свойство, для которого могут быть определены возможные значения. Эти значения берутся из соответствующего домена, который так же должен быть описан. Домены могут быть описаны:
- Перечислением всех возможных значений;
- Ссылкой на документ, где перечислены эти значения;
-Формулировкой правила на некотором глобальном множестве, определяющего какие значения ( из этого множества) допустимы;
- Приведением диапазона допустимых значений.
Организационная структура – это совокупность взаимосвязанных органов управления, расположенных на различных ступенях системы.
Организационная форма – это организация взаимодействия и взаимоотношений между всеми участниками инвестиционного процесса.
Обзор – документ, составленный в целях информирования подведомственных и других организаций о работах в той или иной области или о деятельности группы учреждений в определенный период.
Объяснительная записка – документ, поясняющий содержание отдельных положений основного документа (плана, отчета, проекта).
Отзыв – документ, содержащий мнение учреждения или специалиста по поводу какой-либо работы, присланной на рассмотрение.
Отчет – документ, содержащий сведения о выполнении плана, задания, подготовке мероприятий, представляемый вышестоящему учреждению или должностному лицу.
П
Положение – правовой акт, определяющий права, обязанности и организацию работы учреждения, структурного подразделения.
Постановление – правовой акт, принимаемый высшими и некоторыми центральными органами коллегиального управления в целях разрешения наиболее важных и принципиальных задач, стоящих перед данными органами, и установления стабильных норм, правил поведения.
Приказ – правовой акт, издаваемый руководителем органа государственного управления, действующим на основе единоначалия, в целях разрешения основных и оперативных задач, стоящих перед данным органом.
Проектное управление – совокупное управление всеми трудовыми, финансовыми, материальными и энергетическими ресурсами, требуемыми для обеспечения процессов проектирования и строительства объекта в указанный срок, в пределах запланированной сметной стоимости и с заданным качеством.
План – заранее намеченный порядок, последовательность осуществления какой-либо программы, выполнения работы, проведения мероприятий.
Протокол – документ, фиксирующий ход обсуждения вопросов и принятия решений на собраниях, совещаниях, конференциях и заседаниях коллегиальных органов.
Письмо – обобщенное название различных по содержанию документов, выделяемых в связи с особым способом передачи текста (пересылается по почте).
Предложение – разновидность докладной записки, содержащей перечень конкретных предложений по определенному вопросу.
Перечень – систематизированное перечисление документов или иных предметов, объектов или работ, составленное в целях распределения на них определенных норм или требований.
Р
Реальные объекты – есть предметы реального мира, а точнее, абстракции реальных объектов, как их мы представляем для наших целей.
Решение – правовой акт, принимаемый местными государственными администрациями в коллегианальном порядке в целях разрешения наиболее важных вопросов их компетенции.
Ролевые объекты – абстракции цели или назначения человека, функциональные части оборудования или организации. Например: бухгалтер, экономист, группа по расчету заработной платы, группа ведения учета, студент, преподаватель, ревизор и пр.
Распоряжение - правовой акт, издаваемый единолично руководителем, главным образом, коллегиального органа государственного управления в целях разрешения оперативных вопросов. Как правило, имеет ограниченный срок действия в касается узкого круга организаций, должностных лиц и граждан.
С
Справка - документ, содержащий описание и подтверждение тех или иных фактов и событий.
Сводка – документ, представляющий собой обобщенные сведения по одному вопросу (сводка предложений, замечаний, требований).
Стенограмма – дословная запись докладов, речей и других выступлений на собраниях, совещаниях и заседаниях коллегиальных органов, осуществляемая методом стенографии.
Список – документ, содержащий перечисление лиц или предметов в определенном порядке, составленный в целях информации или регистрации.
Т
Телеграмма – обобщенное название различных по содержанию документов, выделяемых в связи с особым способом передачи текста (передается по телеграфу).
Телефонограмма – обобщенное название различных по содержанию документов, выделяемых в связи с особым способом передачи текста (передается по телефону и записывается получателем).
У
Указывающие атрибуты - используются для идентификации отдельного экземпляра объекта. При этом они могут использоваться самостоятельно или в комбинации с другими атрибутами. Указывающие атрибуты так же должны быть описаны в доменах, как и описательные.
Устав – правовой акт, определяющий структуру, функций и права предприятий. Организаций, учреждения.
Указание - документ, фиксирующий ход обсуждения вопросов и принятия решений на собраниях, совещаниях, конференциях и заседаниях коллегиальных органов.
Ф
Фазами (этапами, стадиями) – называют состояния, через которые проходит проект.
Функциональная структура – управление осуществляется линейным руководителем через группу подчиненных ему функциональных руководителей, каждый из которых имеет право руководить подчиненными подразделениями в пределах порученных ему функций.
Глава 1. Организация делопроизводства в деятельности хозяйствующих субъектов
Замысел и цели разработки системы
В современных условиях важной областью стало информационное обеспечение, которое состоит в сборе и переработке информации, необходимой для принятия обоснованных управленческих решений. Передача информации о положении и деятельности предприятия на высший уровень управления и взаимный обмен информацией между всеми взаимными подразделениями организации осуществляются на базе современной электронно-вычислительной техники и других технических средствах связи.
В деятельности государственных структур, представляющих собой комплексы большого числа повседневно связанных и взаимодействующих подразделений, передача информации является первостепенным и непременным фактором нормального функционирования данной структуры. При этом особое значение приобретает обеспечение оперативности и достоверности информации. Для многих предприятий внутренняя система информации решает задачи организации технологического процесса и носит производственный характер. Здесь информация играет важную роль в предоставлении сведений для принятия управленческих решений и является одним из факторов, обеспечивающих снижение издержек производства и повышение его эффективности.
Соответственную роль в принятии решений играет научно-техническая информация, содержащая новые научные знания, сведения об изобретениях, технических новинках. Это непрерывно пополняемый общий фонд и потенциал знаний и технических решений, практическое и своевременное использование которого обеспечивает предприятию высокий уровень налаженности работ.
Информация служит основой для подготовки соответствующих докладов, отчетов, предложений для выработки и принятия соответствующих решений.
Содержание каждой конкретной информации определяется потребностями управленческих звеньев и вырабатываемых управленческих решений. К информации предъявляются определенные требования:
- по объекту и качеству - краткость и четкость формулировок, своевременность поступления;
- по целенаправленности - удовлетворение конкретных потребностей;
- по точности и достоверности - правильный отбор первичных сведений, оптимальность систематизации и непрерывность сбора и обработки сведений.
Общие требования и задачи, решаемые системами документооборота
Вначале рассмотрим общие требования к системе электронного документооборота.
Масштабируемость. Желательно, чтобы система документооборота могла поддерживать как пять, так, и пять тысяч пользователей, и ее способность наращивать мощность определялась только мощностью аппаратного обеспечения, на котором она установлена. Выполнение этого требования может быть обеспечено с помощью поддержки индустриальных серверов баз данных, производства, например, компаний Sybase, Microsoft, Oracle, Informix, которые существуют практически на всех возможных программно-аппаратных платформах, обеспечивая тем самым максимально широкий спектр производительности.
Распределенность. Основные проблемы при работе с документами возникают в территориально-распределенных организациях, поэтому архитектура системы документооборота должна поддерживать взаимодействие распределенных площадок. Причем они могут быть объединены самыми разнообразными по скорости и качеству каналами связи. Также архитектура системы обязана обеспечивать взаимодействие с удаленными пользователями.
Модульность. Вполне возможно, что заказчику может не потребоваться сразу внедрение всех компонентов системы документооборота, а иногда круг решаемых заказчиком задач меньше всего спектра задач документооборота. Поэтому очевидно, что система должна состоять из отдельных модулей, интегрированных между собой.
Открытость. Система документооборота не может и не должна существовать в отрыве от других приложений, к примеру часто необходимо интегрировать систему с прикладной бухгалтерской программой. Следовательно, система документооборота должна иметь открытые интерфейсы для возможной доработки и интеграции.
Рассмотрим общий спектр задач электронного документооборота. Задачи и, соответственно, необходимая система автоматизации определяются стадией жизненного цикла документа, которую необходимо поддерживать. Вообще жизненный цикл состоит из двух основных стадий.
1. Разработка документа, которая может включать собственно разработку содержания документа, оформление документа, утверждение документа.
В том случае если документ находится на стадии разработки, он считается неопубликованным, и права на него определяются правами доступа конкретного пользователя.
2. Стадия опубликованного документа, которая может содержать: активный доступ, архивный документ краткосрочного и долгосрочного хранения, уничтожение документа.
Когда документ переходит на вторую стадию, он считается опубликованным, и на него остается только одно право - доступ на чтение. В качестве примера опубликованного документа приведем шаблон стандартного бланка предприятия. Кроме права доступа на чтение могут существовать права на перевод опубликованного документа в стадию разработки.
В зависимости от конкретной стадии жизненного цикла документа, с которым имеют дело архивные системы, они подразделяются на следующие типы.
Статические архивы документов (либо просто архивы) - системы, которые обрабатывают только опубликованные документы.
Динамические архивы (либо системы управления документами) работают как с опубликованными документами, так и с теми, которые находятся в разработке.
Дерево работ «Автоматизированная система документооборота»
Рис. 3. Дерево работ «Автоматизированная система документооборота»
Структурная организация Управления Информатизации
В соответствии с положением об Управлении, было создано в 1998 году "Управление информатизации". Целью Управление информатизации явилось объединение в единую корпоративную компьютерную информационную сеть Министерства Транспорта и Коммуникаций и организовать обучение и работу в компьютерной сети интернет руководителей и сотрудников управлений.
Основными задачами Управления являются:
- создание необходимых условий для наиболее полного удовлетворения информационных потребностей государственных органов, предприятий, учреждений, организаций и граждан путем предоставления им доступа к информационным ресурсам на основе внедрения средств вычислительной техники и телекоммуникаций;
- подготовка проектов нормативных правовых актов, определяющих права и обязанности юридических и физических лиц по формированию и использованию информационных ресурсов, средств их обработки и доставки;
- интеграция с мировым информационным пространством;
- создание и развитие информационной инфраструктуры.
Центр компетенции
В связи с "Проблемой 2000 года", по постановлению правительства №117 при Министерстве Транспорта и коммуникаций был создан Центр компетенции, в его функции входит поддержка контактов с обществом для ответа на технические вопросы, повышение осведомленности, сбор и анализ данных, подготовка и распространение отчетов по Y2K прогрессу. Центр компетенции также разрабатывает методы анализа рисков, сертифицирует тесты для ПО и инструментарии, проводит консультации по оценке ИС, а также делает рекомендации по решению проблемы. Центр компетенции организовывает семинары, готовит материалы для средств массовой информации и поддерживает Y2K web-site. Он также готовит все формы для утверждения Техническим советом и Межведомственным комитетом, и отвечает за распространение утвержденных форм. Также, Центр компетенции готовит способы координации и сотрудничества между министерствами, и перед объявлением представляет на рассмотрение Технического совета для утверждения.
На базе Центра компетенции по «Проблеме 2000 года» при управлении информатизации был организован «Проектно-исследовательский «Центр информатизации Министерства транспорта и коммуникаций». «Проектно-исследовательский «Центр информатизации Министерства транспорта и коммуникаций» является проектно-исследовательским учреждением, предназначенным для проведения проектных, исследовательских, образовательных и других работ в области информационных, компьютерных технологий. Центр информатизации в установленном законодательством порядке осуществляет прямые связи с международными организациями, научно-исследовательскими, проектными, учебными и другими юридическими и физическими лицами по всем вопросам сотрудничества.
Структурная организация Управления Информатизации
Рис. 2. Структура организации.
Документирование управленческой деятельности.
В целях дальнейшего совершенствования документационного обеспечения управления и улучшения организации делопроизводства. Правительство Кыргызской Республики постановило утвердить типовую инструкцию по документационному обеспечению управления (делопроизводству) в Кыргызской Республике. Данная инструкция устанавливает совокупность принципов и правил, регламентирующих единые требования к документированию управленческой деятельности и организации работы с документами в учреждениях, организациях и на предприятиях.
Основная цель типовой инструкции – упорядочивание документооборота, сокращение количества и повышение качества подготовки документов, совершенствование работы аппарата управления. Общие требования, изложенные в инструкции, распространяются на организационно – распорядительную документацию. Порядок работы с секретными документами устанавливается специальной инструкцией. Ответственность за организацию и состояние документационного обеспечения управления возлагается на руководителя учреждения, а в структурных подразделениях – на их руководителей.
Состав управленческих документов определяется компетенцией и функциями учреждения, порядком решения вопросов, объемом и характером взаимосвязей с другими учреждениями. Единство правил документирования управленческих действий на всех уровнях управления обеспечивается применением унифицированных систем документации, ГОСТ 6.38-90. Виды и разновидности документов, необходимых и достаточных для работы учреждений, определяются в соответствии с фундаментальным назначением каждого документа в глоссарии.
Составление текстов управленческих документов является выраженное средствами делового языка содержание управленческих действий. Текст документа должен быть ясным, информационно емким и убедительным. Ясность текста или отдельного предложения достигается логичностью и точностью выражения содержания. Логичность текста зависит от расположения элементов в каждом предложении, а также от правильности выбора формы предложения.
Точность текста или предложения заключается в правильном употреблении слов и словосочетаний с точки зрения их значения и формы. Правильность формы слова и словосочетания определяется нормами словообразования, управления, употребления предлогов с учетом специфики деловой речи. Текст управленческого документа и каждое его предложение должны быть информационно емкими. Для этого необходимо избегать слов и словосочетаний, несущих избыточную информацию, не имеющих конкретной смысловой нагрузки. Убедительность является одной из важнейших черт текста документа. Убедительным является документ, содержащий аргументированную и логически обоснованную информацию, необходимую для принятия решения.
Приступая к составлению документа, прежде всего следует определить его целесообразность, убедиться в соответствии предлагаемого содержания компетенции данного учреждения, правильно выбрать вид документа для фиксации управленческого действия.
Стиль документа, характер изложения текста во многом связаны с видом документа. Документ должен отражать объективную действительность, поэтому требование к документу – правдивое, точное, достоверное освещение события, формулировки документа должны быть безупречными в юридическом отношении, текст не должен допускать двояких толкований.
Тексты документов рекомендуется разделять на две основные части. В первой части указывается основание составления документа. Во второй части излагаются выводы, предложения, решения, распоряжения, мнения, просьбы. Если текст такого документа состоит из одной фразы, то в первой ее части указывается основание или причина, во второй – решение. Если же содержание документа не нуждается в пояснении и обосновании, текст может содержать одну заключительную часть: приказы – распорядительная часть без констатирующей, письма – просьбу без пояснения и т.д.
Оформление документов.
Реквизиты документа.
При оформлении документов необходимо соблюдать правила, обеспечивающие юридическую силу, качественное и оперативное исполнение документа.
Для организационно-распорядительных документов устанавливается 31реквизит в соответствии с ГОСТ 6.38-90.
Обязательными реквизитами документов являются: наименования учреждения – автора документа, название вида документа, текст, заголовок к тексту, дата и индекс документа, подпись, отметка об исполнении документа, место создания или издания документа, код организации – автора, код формы документа.
В процессе подготовки и оформления документов состав обязательных реквизитов при необходимости может быть дополнен другими реквизитами.
Бланк документа.
Применение бланков при подготовке документов повышает культуру управленческого труда, придает информации официальный характер, облегчает исполнение и дальнейшее использование документа. Служебные документы составляются на бланках форматов А-4 и А-5, отпечатанных типографским способом, в соответствии с ГОСТ 9327-60. Для отдельных видов документов допускается применение формата А-3.
Установлено два вида бланков: бланк письма и общий бланк для всех других видов организационно-распорядительных документов.
Бланк письма состоит из следующих реквизитов, отпечатанных типографским способом. Для каждого из этих видов бланков допускает два варианта расположения реквизитов – угловой и продольный. При продольном расположении реквизитов наименование учреждения размещается вдоль верхнего поля документов. При угловом – границы левого края в верхнем углу.
Заголовок документа.
Заголовок – краткое изложение содержание документа. Он должен быть максимально кратким и емким, точно передавать смысл текста, грамматически согласовываться с названием документа. Если в документе отражается несколько вопросов, то заголовок формируется обобщенно. К документам большого объема, или отражающим несколько вопросов, наряду с заголовками составляются подзаголовки. Их располагают в левой части листа.
4. Датирование.
Датой документа является дата его подписания, утверждения или события, которое зафиксировано в документе. Даты подписания, утверждения, согласования, а также содержащиеся в тексте, оформляют цифровым способом. Элементы даты приводятся в одной строке в следующей последовательности: число месяца, месяц, год.
5. Согласование.
Подготовленные проекты документов перед подписанием в ряде случаев согласовывается с заинтересованными учреждениями, структурными подразделениями, отдельными должностными лицами. Это делается для подтверждения их согласия с содержанием документа. Согласование проводится внутри учреждения и вне его.
Внутреннее согласование обычно оформляется визой, состоящей из должностей визирующего, подписи, ее расшифровки и даты. Визируются экземпляры документов, которые остаются в учреждении.
Внешнее согласование может быть оформлено грифом согласования, листом согласования. Гриф согласования состоит из слова «Согласовано», наименование должности лица, с которым согласовывается документ, личной подписи, ее расшифровки и даты, и располагается после реквизитов «Подпись» в левой части бланка.
Движение документов в учреждении с момента их получения или создания до завершения исполнения, отправки или сдачи в дело образуют документооборот.
Прохождение документов в учреждении должно быть оперативным и целенаправленно регулироваться. Следует исключить инстанции прохождения и действия с документами, не обусловленные деловой необходимостью. Каждое перемещение документов должно быть оправданным.
Прием и первичная обработка поступающей корреспонденции в учреждении осуществляется в централизованном порядке экспедицией или работниками служб делопроизводства. Все конверты, за исключением личной корреспонденции и писем в адрес общественных организаций, вскрываются. При этом проверяется целостность конвертов и наличие вложенных в них документов. При обнаружении повреждения, отсутствие документов или приложения к ним необходимо сообщить об этом отправителю. Конверты, как правило, уничтожаются, кроме случаев, когда только по конверту можно установить адрес отправителя или время отправки и получения документа.
Ошибочно доставленная корреспонденция пересылается по принадлежности. Документы сортируются на регистрируемые и нерегистрируемые.
Глава 2. Концептуальное и информационное моделирование
Выявление и моделирование бизнес – процессов.
Основу деятельности любой организации составляют ее деловые процессы или бизнес-процессы, которые определяются целями и задачами организации. Каждый бизнес-процесс характеризуется четко определенными во времени началом и концом. Для каждой работы, входящей в бизнес-процесс, определены временные характеристики, определяющие ее место в общей последовательности работ. Описание деятельности организации с помощью бизнес-процессов позволяет определить где, когда и кем выполняется каждая функция, какие данные, информационные или функциональные взаимосвязи для этого нужны и откуда эти данные поступают.
В данной выпускной работе рассматривается работа Управления Информатизации и ее подразделений.
Каждый бизнес-процесс характеризуется четко определенными во времени началом и концом, внешними интерфейсами, которые либо связывают его с другими бизнес - процессами внутри организации, либо описывают выход во внешнее окружение, последовательностью выполняемых работ и правилами их выполнения (бизнес-правилами). Для каждой работы, входящей в бизнес-процесс, определены временные характеристики, определяющие ее место в общей последовательности работ, условия инициализации и время выполнения.
Создаваемая модель бизнесс-процессов организации строится на базе построенных бизнесс-процессов по результатам обследования деятельности организации, проводимого на уровне подразделений.
На этом этапе проводится обследование подразделений, в результате которого выявляются выполняемые в них основные функции, их вход и выход. Эти функции распределяются по бизнесс-процессам, проходящим через каждое подразделение. В результате формируются и уточняются общие списки бизнес-процессов и функций по подразделениям, списки входных и выходных документов и другие характеристики, и вся эта информация наполняет каждый бизнес-процесс конкретным содержанием.
В процессе отображения бизнес-процессов по уровням организационной иерархии формируется и уточняется общий список бизнес-процессов, и могут появиться новые бизнес-процессы.
Главной целью создания модели бизнесс-процессов предприятия является детализация описания деятельности организации. От уровня описания реализации общих бизнесс-процессов в организации и списковых моделей в подразделениях до уровня детальных моделей подразделений, позволяющих выделить все функции подразделений, обрабатываемые документы, основные данные, описать регламент работы персонала и создать в итоге функциональную модель организации и концептуальную модель данных.
Выявленные в процессе обследования подразделения функции распределяются по бизнесс-процессам этого подразделения, наполняя их конкретными работами данного подразделения. При этом описания бизнесс-процессов могут дополняться и уточняться. В моделях описываются и детализируются бизнес-процессы, функции, информационные потоки, входные и выходные документы, взаимодействие внутри организации и с внешними объектами, данные, бизнес - правила, роли персонала и регламент, их взаимосвязи, временные и прочие характеристики.
Модель бизнес-процессов Управления Информатизации описываются в Приложении 1. Созданные в средстве анализа (Upper CASE), предназначенном для построения и анализа моделей предметной области (BPwin (Logic Works)). На основе созданной в Bpwin системе, можно построить отчеты, диаграммы.
BPwin – это мощный инструмент моделирования, который используется для анализа, документирования и реорганизации сложных бизнес-процессов. Модель, созданная средствами BPwin, позволяет четко документировать различные аспекты деятельности - действия, которые необходимо предпринять, способы их осуществления, требующиеся для этого ресурсы и др. Таким образом формируется целостная картина деятельности предприятия - от моделей организации работы в маленьких отделах до сложных иерархических структур. Модели BPwin дают основу для осмысления бизнес - процессов и оценки влияния тех или иных событий, а также описывают взаимодействие процессов и потоков информации в организации. Неэффективная, высоко затратная или избыточная деятельность может быть легко выявлена и, следовательно, усовершенствована, изменена или устранена в соответствии с общими целями организации.
Концептуальное моделирование
С точки зрения системного анализа концептуальное моделирование является структуризацией предметной области, для которой разрабатывается система. Ее цель - выявление перечня и иерархии предметов, объектов, факторов и явлений, полный набор которых позволяет реализовать поставленные перед системой цели и задачи.
Согласно методологии ООАПиП системный анализ проекта предполагает на первом этапе рассмотрение и физическое моделирование предметной области. На данном этапе проводится расчленение (выделение, разбивка) предметной области, объектов системы на ряд подоблостей или подсистем (уровней), характеризуемых целостностью их восприятия и однородностью выполняемых работ (функций).
При этом требуемый критерий целостности восприятия дает право продолжать расчленение до тех пор пока предмет или объект (фактор системы) не перестанет восприниматься как в свою очередь состоящий из объектов, т.е. до элементарного, неделимого уровня.
Критерий однородности выполняемых работ (функций) дает возможность использовать концептуальную модель для корректировки разработанного во введении дерева работ.
Результаты концептуального моделирования являются базисными для реализации этапов информационного моделирования и затем разработки моделей состояний (жизненных циклов системы) - моделей, определяющих функционирование разрабатываемой системы.
Для углубленного изучения и закрепления проделанной работы, немаловажную роль играет детальное рассмотрение различных объектов.
Именно в этом состоит задача концептуального моделирования. Иными словами говоря концептуальное моделирование включает системное представление доменов предметной области с кратким описанием назначения или функций объекта и структуризацию факторов (атрибутов).
Так как, объекты составляют основу концептуального моделирования, я хотел бы остановиться на них более подробно.
Объект это абстракция множества предметов реального мира. Различают следующие виды объектов:
Реальные объекты – предметы реального мира, а точнее абстракции реальных объектов, как их мы представляем для наших целей. Например: завод, бухгалтерия, склад.
Ролевые объекты – абстракции цели или назначения человека, функциональные части оборудования или организации. Например: бухгалтер, экономист, аудитор.
Инциденты – абстракция чего-то произошедшего или случившегося. Например: перечисление в банк, проводка, платежи, поставка.
Взаимодействие – объекты получаемые из отношений с другими объектами. Например: контракт, платежная ведомость, налоги, главная книга.
Спецификация – используется для представления правил, нормативных документов или критериев качества, стандартов.
Методы концептуального моделирования используют широкий диапазон математических средств и методов представления знаний. Широко используются как древовидные, так и сетевые конструкции, в которых различаются как вершины, так и ребра. Одним из видов являются графы связей, позволяющие разбивать структуру на узкие классы объектов системы. Очень часто графы связей отображаются таблицами в виде логических матриц отношений. Построение графов связей или таблиц один из распространённых методов формализации проектных задач. В данной курсовой работе была выбрана древовидная структура как более удобная и наглядная в конкретном случае. Древовидная или иерархическая структура – эта структура, в которой каждый компонент системы, исключая первый непосредственно подчиняется только одному (вышестоящему) компоненту структуры. Это хорошо видно в (Приложении 2) на приведенных примерах концептуальных моделей.
Информационное моделирование
Цель этапа информационного моделирования состоит в том, чтобы идентифицировать концептуальные сущности, или объекты, которые составляют подсистему для анализа. Объекты информационной модели представляются через их имена и имена их атрибутов. Здесь устанавливаются связи между информационными объектами и функциональные зависимости.
Кроме структурной направленности информационное моделирование связанно с особенностями реализации связей в различных компьютерных технологиях, в зависимости от количества связываемых предметов.
Методология ООАПиП, в этой связи различает и рассматривает три вида связей:
1) один к одному
2) один ко многим
3) многие ко многим
Это объясняется различными подходами и методами их реализации в отдельных компьютерных технологиях. Так, связи один к одному реализуется преимущественно матрицами, связи один ко многим на базе реляционной алгебры и реляционных таблиц, а связи “многие ко многим” требуют использования вспомогательного объекта.
Поэтому данная глава курсовой работы двунаправлена - решает как задачу структуризации системы, так и задачу анализа и формирования упомянутых трех видов связей.
Кроме того, в методологии ООАПиП принят графический вид информационных моделей, как предварительных, базисных для последующего моделирования состояний - жизненных циклов.
В информационной модели каждому объекту должно быть назначено уникальное имя. При этом имя должно явно указывать отношение объекта или к классу объектов или к экземпляру.
Для успешной реализации проекта объект проектирования должен быть прежде всего адекватно описан, должны быть построены полные и непротиворечивые функциональные и информационные модели ИС. Накопленный к настоящему времени опыт проектирования ИС показывает, что это логически сложная, трудоемкая и длительная по времени работа, требующая высокой квалификации участвующих в ней специалистов. Однако до недавнего времени проектирование ИС выполнялось в основном на интуитивном уровне с применением неформализованных методов, основанных на искусстве, практическом опыте, экспертных оценках и дорогостоящих экспериментальных проверках качества функционирования ИС. Кроме того, в процессе создания и функционирования ИС информационные потребности пользователей могут изменяться или уточняться, что еще более усложняет разработку и сопровождение таких систем. Ручная разработка обычно порождала следующие проблемы:
неадекватная спецификация требований;
неспособность обнаруживать ошибки в проектных решениях;
низкое качество документации, снижающее эксплуатационные качества;
затяжной цикл и неудовлетворительные результаты тестирования.
Перечисленные факторы способствовали появлению программно-технологических средств специального класса - CASE-средств, реализующих CASE-технологию создания и сопровождения ИС. Термин CASE (Computer Aided Software Engineering) используется в настоящее время в весьма широком смысле. Первоначальное значение термина CASE, ограниченное вопросами автоматизации разработки только лишь программного обеспечения (ПО), в настоящее время приобрело новый смысл, охватывающий процесс разработки сложных ИС в целом. Теперь под термином CASE-средства понимаются программные средства, поддерживающие процессы создания и сопровождения ИС, включая анализ и формулировку требований, проектирование прикладного ПО и баз данных, генерацию кода, тестирование, документирование, обеспечение качества, конфигурационное управление и управление проектом, а также другие процессы. CASE-средства вместе с системным ПО и техническими средствами образуют полную среду разработки ИС.
CASE-технология представляет собой методологию проектирования ИС, а также набор инструментальных средств, позволяющих в наглядной форме моделировать предметную область, анализировать эту модель на всех этапах разработки и сопровождения ИС и разрабатывать приложения в соответствии с информационными потребностями пользователей. Большинство существующих CASE-средств основано на методологиях структурного (в основном) или объектно-ориентированного анализа и проектирования, использующих спецификации в виде диаграмм или текстов для описания внешних требований, связей между моделями системы, динамики поведения системы и архитектуры программных средств.
Пример информационной модели данных по системе «Автоматизированная система документооборота» проработан в системе ERwin. (Приложение 3)
Определение жизненного цикла модели.
Необходимость анализа и разработки больших сложных, а в последнее время и сверхсложных систем, появление и использование при этом новых методологий, в частности ООАПиП, корпоративное проектирование, методология управления проектами, появление современных компьютерных технологий привело к следующему факту:
- при планировании и реализации этих работ алгоритмический подход, которым ранее широко пользовались, имеет существенный недостаток препятствующий этим работам.
Обнаружилось, что при алгоритмическом подходе трудно отслеживать все нюансы поведения (изменений состояний) анализируемых и разрабатываемых информационных объектов и систем, охватить все аспекты их поведения (функционирования), управления и пребывания в отдельных промежуточных состояниях. В связи с этим современные методы анализа разработки, моделирования, а также компьютерной технологии предлагают рассматривать поведение информационных объектов и систем в динамике (при функционировании) вводя понятие жизненного цикла объектов, подсистем, систем и надсистем.
Жизненный цикл представляет как модель их поведения, т.е. переход из одного состояния в другое. При этом считается наиболее подходящей моделью для представления жизненного цикла дискретный автомат Мура. С этих позиций проанализируем и сопоставим трактовку модели представления жизненного цикла (состояний) методологии ООАПиП и классическую модель конечного автомата Мура представляющего частный их вид – автоматы без выходов . Методология считает , что модель имеет следующий состав :
1. Множество состояний. Каждое состояние представляет стадию или этап в жизненном цикле типичного экземпляра объекта, при этом в качестве объектов рассматриваются не только элементарные но и подсистемы и надсистемы. С точки зрения теории КА – это внутреннее состояние автомата которое, как правило, обозначается в алфавите Q.
2. Множество событий. Каждое событие представляет собой некоторое законченное действие влекущее за собой некоторое действие изменяющее поведение, состояние объекта или системы.
3.
Множество
правил перехода. Правило
перехода определяет в какое следующее
состояние переходит объект или система
совпадая с теорией КА.
4.
Действия.
Действия –это деятельность или
совокупность операций которые должны
быть выполнены над объектами системы
для достижения определенного состояния.
По крайней мере одно определенное действие должно быть связанно каждым состоянием, с точки зрения теории КА действие соответствует функциям перехода.
Придание функциям перехода более широкого смысла действия расширяет возможности моделирования жизненных циклов поскольку внутреннее состояние рассматривается в течении промежутка времени во время которого решается частная задачи ведущие к достижению данного состояния или совершается определенная работа результатом которой является данное состояние.
В качестве примеров действий приводятся выполнение расчетов над некоторой промежуточной таблицей; реализации элементарного этапа; действие по достижению заданного критериального значения; определенная работа требующееся для достижения данного состояния; определенной обработки данных заданных состояний и т.п.
Анализ описания действий в методологии ООПиП рпиводит к выводу, что это понятие подробно обсуждается в связи с удобством его использования при реализации модели состояний в различных компьютерных технологиях.
С другой стороны широкой трактовкой действия подтверждается сущность систем как интерпретирующих блок-схемы системы. Ибо как указанно выше интерпретирующая система по своему определению связанна с определенными действиями.
Каков бы ни был замысел проекта, сам по себе, без реализации он мало что значит. Важен результат выполнения проекта, нужна работа по его осуществлению. Каждый проект независимо от его сложности и объема работ, необходимых для его выполнения, проходит в своем развитии определенные состояния: от состояния, когда «проекта еще нет», и до состояния, когда «проекта ужу нет». Это упрощенное представление о «начале» и «конце» жизни проекта требует уточнения.
Что считать началом проекта? Иногда это момент рождения идеи, особенно если ее рождению предшествовал скрупулезный поиск. Для деловых людей начало проекта связанно скорее с началом его реализации и началом вложения денежных средств в его выполнение.
Концом проекта может быть:
завершение работ над его реализацией, то есть ввод проекта в действие
перевод персонала, выполняющего проект, на другую работу
достижение проектом заданных результатов
прекращение финансирования проекта
Понятие жизненного цикла ее программного обеспечения (ЖЦ ПО) - это непрерывный процесс, который начинается с момента принятия решения о необходимости его создания и заканчивается в момент его полного изъятия из эксплуатации.
Согласно сложившейся практике, состояния, через которые проходит проект, называют фазами (этапами, стадиями).
Деление проекта на фазы может быть самым разнообразным, такое деление выявляет некоторые важные контрольные точки «вехи», во время прохождения которых просматривается дополнительная информация и оцениваются возможные направления развития проекта.
В свою очередь каждая выделенная фаза (этап) может делиться на фазы следующего уровня (подфазы, подэтапы) и т.д.
Применительно к очень крупным проектам, количество фаз и этапов их реализации может быть увеличено. Выделение дополнительных этапов связанно с необходимостью более тщательного согласования действий.
Глава 3. Математическое моделирование
Проблема поиска и индексирования документов
Наряду с организацией хранения документов, их необходимо также быстро и эффективно искать. Со скоростью поиска все относительно понятно - чем быстрее вы найдете необходимые документы, тем лучше. А вот с эффективностью поиска документа ситуация не так проста. Что считать эффективным поиском? Для того чтобы понять это, рассмотрим модели поиска. Здесь существует два подхода. Первый состоит в том, что в процессе поиска вы ищете документ, который точно существует в системе, и ваша задача - свести процесс к его нахождению. Этот метод применяется в 90% всех случаев. Второй подход состоит в том, что вы ищете все документы, которые могут относиться к интересующему вас вопросу. Очевидно, применение данного подхода целесообразно в аналитических и исследовательских задачах. Для него характерны такие термины, как полнота поиска - соответствие между найденными документами по данному запросу и действительному списку документов; шум при поиске - соотношение (соответствие) соответствующих и несоответствующих запросу документов.
Существует два основных типа поиска. Атрибутивный, когда каждому документу присваивается набор определенных атрибутов (полей). При сохранении документа в архив поля заполняются определенными значениями, в дальнейшем при поиске проверяется совпадение значений этих полей запросу. К атрибутам документа можно отнести имя документа, время создания, автора, машинистку, имя подразделения, тип документа (факс, письмо, контракт, спецификация). Ясно, что список таких атрибутов должен быть расширяем. Их совокупность называется карточкой документа. Поля могут заполняться произвольно или из предопределенных справочников. Причем последнее наиболее предпочтительно, так как сужает области поиска.
Второй тип поиска носит название полнотекстовый. В этом случае автоматически обрабатывается все содержание, как правило предварительно проиндексированного, документа, и затем его можно найти по любому входящему в него слову.
Соответственно, существует зависимость между типами поиска и подходами к поиску. Для поиска известного документа более пригоден атрибутивный поиск, тогда как для исследовательского - полнотекстовый. Существует комбинация полнотекстового и атрибутивного поиска, когда атрибуты документа обрабатываются так же, как все содержание документа. Полнотекстовый поиск зависит от формата документа и языка, на котором он создан. Электронный документ любого формата необходимо предварительно преобразовывать в плоский текст для обработки системой полнотекстового поиска, следовательно, любая такая система должна содержать в своем составе конвертеры форматов.
Зависимость от языка выражается в следующих факторах:
Поиск документа более полный, если в результате запроса будут найдены не только документы, которые точно соответствуют слову в запросе, но и те, в которых присутствуют различные его словоформы. Данная технология носит название нормализации. Причем эффективность метода зависит от применяемого алгоритма. Для русского языка наиболее эффективен словарный метод, когда слово нормализуется на основе словарей, в которых содержатся словоформы. Кроме словарного может применяться эвристический метод нормализации, когда слово может быть приведено к нормальному виду путем выполнения определенных правил, описывающих алгоритм нормализации. Если для английского языка свод правил нормализации составляет 300 страниц машинописного текста, то для русского он на несколько порядков больше.
Аналогично нормализации было бы логично выполнять поиск не только по конкретному слову, но и его синонимам.
Процессом, аналогичным индексации, в бумажном делопроизводстве является регистрация.
Регистрация является "священной коровой" делопроизводства. Историческая неразвитость системы управления в сочетании с большими расстояниями и традиционно низкой ответственностью исполнителей породила своеобразный, скрупулезный подход к регистрации документов на всех уровнях управления.
Хрестоматийным примером может послужить журнал учета входящих документов. Индексация электронных документов, осуществляемая системами автоматизации делопроизводства, преследует несколько иную цель – получить максимальное количество достоверной информации о формируемом документе и создать его регистрационную карточку. Процесс этот тем более важен, что в дальнейшем система управления документами имеет дело именно с этой карточкой, не затрагивая реальные объекты файловой системы. Далее мы в общих чертах рассмотрим известные методы индексации.
Итак, на основе вышесказанного становится очевидным то, что успешный поиск документа во многом зависит от реализованного в системе метода индексирования документов. Рассмотрим основные положения индексирования.
Индексирование документа обычно организуется через автоматическую обработку его текста и заполнение метаданных. Автоматическая обработка – полнотекстовое индексирование – заключается в преобразовании текста документа в набор слов. Причем обычно для слов сохраняется их позиция в документе, для обеспечения возможности поиска по словосочетаниям. Существуют два принципиально различных метода такого индексирования с учетом применяемых в дальнейшем методов поиска:
бинарное индексирование – не зависит от языка документа по причине бинарной или словарной индексации;
морфологическое индексирование – производится с учетом морфологии и семантики языка.
При бинарном индексировании поиск ведется на основе алгоритмов “нечеткого поиска”, т.е. поиска с ошибками. В этом случае допускается неполное (с заданным количеством ошибок в начале, середине и конце слова) совпадение слов с шаблоном. При втором методе индексации слова преобразуются в словоформы с отсечением суффиксов и окончаний, что позволяет искать склонения и спряжения шаблонов.
Стандарта на метаданные на текущий момент не существует, но обычно они включают по крайней мере дату создания документа, его размер, возможно, тип и автора, краткое содержание – аннотацию и ключевые слова. Стоит отметить, что последние поля (аннотация и ключевые слова) на сегодняшний день заполняются вручную. При этом, если формат документа их предусматривает и автор их заполнил, то все неплохо, но практически всегда в реальных документах они отсутствуют. Поэтому существующие сегодня системы документооборота их обычно игнорируют по причине крайне дорогого и медленного их заполнения оператором, вводящим документы в систему.
Векторная и линейная модель индексирования и поиска документов
Ниже приведен разработанный алгоритм процесса индексирования документа:
Присвоение документу уникального идентификатора, внесение в файл идентификаторов
Определение формата документа
Определение кодировки документа
Перевод текста в «плоский» формат
Определение единицы поиска
Выделение отдельных слов
Выделение отдельных предложений
Исключение из запроса шумовых слов
Составление (пополнение) индекса определенного формата (рис. 4)
Слово |
id документа, номер слова, номер слова, . . . |
id документа, номер слова, номер слова, . . . |
Рис. 4 Формат индекса
При индексировании нового документа в уже существующий индекс напротив слов добавляется идентификатор нового документа и номера данного слова в нем. При этом идентификаторы документов сортируются в соответствии с количеством вхождений слова в документ.
Таким образом, приведенный выше алгоритм обеспечивает составление единого индекса для всех индексируемых документов, что существенно уменьшает объем занимаемого индексами дискового пространства, а также уменьшает время, затрачиваемое на поиск документа.
В модели информационного потока вообще можно выделить несколько основных понятий: словарь, документ, поток и процедуры поиска и коррекции запросов.
Под словарем понимают упорядоченное множество терминов, мощность которого обозначают как D.
Документ - это двоичный вектор размерности D. Если термин входит в документ, то в соответствующем разряде этого двоичного вектора проставляется 1, в противном же случае - 0. Обычно все операции в линейной модели индексирования и поиска документов выполняются над поисковыми образами документов, но при этом их как правило называют просто документами.
Информационный поток или массив L представляют в виде матрицы размерности NxD, где в качестве строк выступают поисковые образы N документов. При таком рассмотрении можно сформулировать процедуру обращения к информационной системе следующим образом:
L x q = r; (1)
где q - вектор запроса, r - отклик системы на запрос.
Это традиционное определение процедуры поиска документов в информационно-поисковой системе, которое ввел Солтон в 1977 году. Оно было введено для решения проблемы автоматического индексирования документов, но оказалось чрезвычайно полезным и для описания процедуры поиска.
Существуют и другие определения процедуры обращения пользователя к системе, но для описания работы распределенных информационно-поисковых систем в интернете больше подходит определение Солтона - в подавляющем большинстве этих систем применяются информационно-поисковые языки типа "Like This". Данный подход хорошо известен как вычисление мер близости "документ-запрос".
В современных распределенных информационно-поисковых системах Internet реально используются только 6 мер близости. При этом наиболее часто в качестве меры близости рассматривают определение Солтона, например, системы RBSE и WAIS, и его же улучшенную меру близости - системы WebCrawler и Lycos.
Начало применению запросов типа "Like This" положила система WAIS. Именно в ней был впервые сформулирован отказ от использования традиционных информационно-поисковых языков булевого типа и было заявлено о переносе центра тяжести информационного поиска на языки, основанные на вычислении меры близости "документ-запрос". Основная причина такого подхода - желание снять с пользователей заботу по формулированию запросов на информационно-поисковых языках и дать им возможность использовать обычный естественный язык. Ради справедливости следует отметить, что от запросов на естественном языке практически сразу отказались. Система просто проводила нормализацию лексики и удаляла из списка терминов запроса общие и стоп - слова. Тем самым практически один в один выполнялись условия линейной модели индексирования и поиска. После этой процедуры система вычисляла меру близости по выражению и в соответствии с полученными значениями ранжировала информационный массив. Практически все информационно-поисковые системы в интернете устроены по этому принципу. Единственным исключением является применение более сложных мер близости.
В приложении 4 приведен разработанный алгоритм процесса обработки запроса.
Коррекция запросов по релевантности
Другим важным способом улучшения качества поиска в информационно-поисковых системах стала процедура коррекции запроса по релевантности. Пионером здесь также выступила система WAIS. Пользователю предоставлялась возможность отметить документы, которые являлись релевантными его запросу. После этого запрос расширялся терминами этих документов и снова вычислялось выражение (1) для поисковых образов документов всего массива. В рамках линейной модели индексирования и поиска эта процедура может быть также выражена через матричные выражения.
В литературе по информационному поиску часто можно встретить термин "профиль", который относят к запросам пользователей. Но информационный профиль или тематический профиль имеется и у информационной системы. Наиболее просто тематический профиль системы материализуется в виде классификации, которая применяется в данной системе или рубрикаторе. Не исключение и информационные системы интернета, в которых профиль играет еще и роль навигационного средства, позволяющего получить доступ непосредственно к набору документов, попадающих в тот или иной раздел классификации. При этом многие системы интернета имеют несколько профилей, которые могут быть соотнесены с фасетной классификацией.
Естественно, что при таком положении дел в моделях, предназначенных для описания работы в информационно-поисковые системы, так же должно быть введено понятие профиля и выявлена его актуальность для информационного поиска.
Определим операцию расширения запроса как:
LT x r0 = q1 (2)
В данном выражении LT - это транспонированная матрица L. Однако, это не совсем точно. Обычно пользователь не использует свое право отметки релевантных документов и только их термины используются в расширенном запросе или получают больший вес перед терминами других документов. Поэтому в выражение (2) надо ввести еще матрицу - F, призванную учитывать фактор пользователя.
LT x Fk-1 x rk-1 = qk (3)
L x qk = rk;
Как видно из (3) матрицы Fk-1 составляют систему фильтров пользователя, при помощи которых он корректирует свой запрос. Эти фильтры имеют в реальных системах конкретную интерпретацию. Так в WAIS и Lycos пользователь просто помечает релевантные документы. В этом случае фильтры превращаются в диагональные матрицы, которые в релевантных документах имеют главную диагональ с единицами, а в нерелевантных - нули. Но, в общем случае, на диагонали можно размещать и веса релевантности. Эти фильтры могут быть и недиагональными. В этом случае пользователь будет взвешивать документы не только самостоятельно, но и с учетом их связи с другими документами массива, как релевантными, так и нерелевантными, например с учетом его гипертекстовых связей. Но в любом случае совершенно естественно предположить, что система предпочтений пользователя в течение одной сессии работы с информационно-поисковой системой остается неизменной, иначе пользователь просто не знает, что же он в самом деле ищет. Тогда все фильтры одинаковы и не изменяются от шага к шагу:
F0 = F1 = F2 = ... = Fk-1 = Fk = F (4)
В конечном итоге, если пользователь просто переберет все документы массива, то можно составить диагональную матрицу, например, состоящую из нулей и единиц.
Процесс коррекции запроса не бывает бесконечным. Обычно он завершается, когда пользователь устает просматривать найденные документы, и приходит к выводу, что нашел искомое, либо действительно больше нет новых релевантных документов. В принципе, даже при прямом просмотре, второй результат является концом процедуры поиска информации. Это значит, что начиная с некоторого вектора отклика этот самый отклик не изменяется:
(L x LT x F) x rk-1 = rk; (5)
(A x F) x r = lr:rk = lrk-1.
Из (2.5) следует, что процесс коррекции запросов по релевантности должен сходиться к собственному вектору матрицы ( L x LT x F). Если при этом пользователь хочет добиться максимального различия документов по степени релевантности, которая фактически определяется значениями компонентов вектора r, тогда речь идет о собственном векторе при максимальном собственном числе. Аналогичный результат можно получить и для набора терминов, которые характеризуют информационную потребность пользователя.
Однако, кроме профилей пользователя при моделировании взаимодействия пользователя и информационной системы. Существенную играет роль сам информационный массив, а точнее набор информационных образов документов массива, скажем, в ранжировании документов по степени релевантности. А именно об этом и идет речь в линейной модели индексирования и поиска информации. Чем ближе оказываются документы к информационной потребности пользователя, тем проще структура матрицы F. Идеальный случай, если эта матрица будет единичной - тогда пользователь вообще не нуждается в ручной коррекции, а система сама проранжирует все документы.
Приведенная трактовка процедуры коррекции запроса и профиля информационной системы имеет аналоги в других методах анализа информационных потоков. Если надо различить какие-либо группы пользователей по их тематике с применением некоторой информационной структуры, то можно прибегнуть к факторному анализу статистики посещения страниц. В этом случае главные компоненты будут задаваться собственными векторами корреляционной матрицы, которая позволяет определить направление максимального разброса показателей посещений, что соответствует собственному вектору при максимальном собственном числе.
Глава 4. Программирование
Для написания программы была выбрана интегрированный объектно?ориентированный язык программирования Borland Delphi 5 Enterprise. На сегодня Delphi является одним из самых распространенных средств создания приложений баз данных для корпоративных применений.
Эти средства позволяют создавать прикладные программы, предназначенные для работы на ПЭВМ IBM PC AT под управлением оболочки Windows 98 и более поздних версий, а так же операционной системы Windows NT и использующие общепринятые для Windows элементы пользовательского интерфейса. Программы такого типа в настоящее время признаны в качестве стандарта , поскольку наиболее широко распространены, удобны для пользователей и не требуют долгого их обучения.
Предпочтение было отдано системе Borland Delphi 5 Enterprise благодаря тому, что она позволяет программисту очень быстро и удобно разрабатывать пользовательский интерфейс. Это свойство особенно ценно из-за того, что, как показывает практика, работа над интерфейсом занимает большую часть (до 80%) времени создания программного продукта. Еще одним преимуществом выбранной системы является высокая (по сравнению со многими другими средствами программирования) эффективность генерируемого компилятором кода, что весьма существенно для данного проекта.
Листинг программного кода приведен в Приложении 5. Иллюстрации внешнего интерфейса в Приложении 6.
Заключение
В любой организации, как большой, так и маленькой, возникает проблема такой организации управления данными, которая обеспечила бы наиболее эффективную работу. Небольшие организации используют для этого шкафы с папками, однако крупные корпоративные предприятия используют компьютеризированные системы автоматизации, позволяющие эффективно хранить, извлекать информацию и управлять большими объемами данных.
Темпы внедрения новых технологий в компьютерной отрасли вызывают изумление. Компании, конкурирующие за рынки и прибыли, стремятся моментально реализовать технические новшества в аппаратных средствах, программном обеспечении и парадигмах вычислений, стимулирующих развитие всей технологии управления информацией. Однако для успешной реализации крупных систем управления требуется применить нестандартный подход, творческое решение. Использование основ эргономики при проектировании, реализации и внедрении системы управления позволит решить многие «психологические» и «технологические» проблемы предприятий.
В данной выпускной работе решены следующие задачи:
1. Приведена структура оформления документов
2. Выполнена постановка задачи на разработку функций поиска информации в системе документооборота
3. Рассмотрены преимущества полнотекстовой индексации документов как основа для математического аппарата решения поставленной задачи и разработана математическая модель, реализующая выбранный алгоритм индексации документов.
Список использованной литературы.
Шапиро И. Д., «Управление проектами». СПБ, 1996 «Два-Три»
Вендров А.М. «Один из подходов к выбору средств проектирования баз данных и приложений. "СУБД"». 1995, №3.
Методическое пособие по дисциплине «Информационные технологии в экономике»
Панащук С.А. «Разработка информационных систем с использованием CASE-системы Silverrun. "СУБД"», 1995, №3.
Бэрри Н. «Компьютерные сети» Пер. с англ. – М. БИНОМ, 1995.
6. «Типовая инструкция по документационному обеспечению управления (делопроизводству) в Кыргызской Республике» утверждена Постановлением Правительства Кыргызской Республики от «» №
7. Андреева В. И. «Делопроизводство» - М. «Бизнес-школа «Интел-Синтез»», 1997.
8. Стенюков М. В. «Образцы документов по делопроизводству (руководство к составлению)» - М. «ПРИОР», 1996