Вход

Лекции по XML

Лекция по компьютерным сетям
Дата добавления: 29 сентября 2010
Язык лекции: Русский
Архив, rar, 1 Мб
Лекцию можно скачать бесплатно
Скачать
Данная работа не подходит - план Б:
Создаете заказ
Выбираете исполнителя
Готовый результат
Исполнители предлагают свои условия
Автор работает
Заказать
Не подходит данная работа?
Вы можете заказать написание любой учебной работы на любую тему.
Заказать новую работу

ОГЛАВЛЕНИЕ

Введение в XML

Синтаксис XML

Определения типа документа

Моделирование данных и XML

Объектная модель документа

Пространства  имен и схемы

Связи и запросы               

Трансформация документа XML

Дизайн документов XML

Web-службы

Атрибуты

Любой тэг может иметь атрибут, если этот атрибут определен. Атрибуты принимают форму пар имя/значение (name/value) (их также называют парами атрибут/значение - attribute/value). Таким образом, каждому элементу может быть присвоен атрибут с именем. В то же время этот атрибут должен иметь некоторое значение. Тогда тэги принимают форму:
(<имя_тэга  атрибут = "значение"'>

Языки разметки


В этом  разделе мы рассмотрим три языка разметки; SGML, HTML и, конечно, XML SGML - это метаязык, который используется для создания других языков разметки. Наиболее известным из них, написанным в стандарте SGML, является всеми нами любимый HTML, ведь именно он применяется в Web. Поскольку язык HTML разработан в соответствии с правилами SGML, его называют приложением SGML. Проблема практического употребления SGML состоит в том, что он очень сложен. Поэтому нам и интересен XML, созданный специально для Web как упрощенная версия SGML, сохраняющая большую часть его функциональных возможностей. Рассмотрим подробнее возможности каждого из упомянутых выше языков разметки.

Язык SGML
 

В 1986 году, задолго до того, как идея создания Web была воплощена в жизнь, универсальный стандартизированный язык разметки SGML (Standardized Generalized Markup Language) был утвержден в качестве международного стандарта (ISO 8879) определения языков разметки. Кстати, SGML существовал еще с конца шестидесятых. В ту пору его использовали для того, чтобы описывать языки разметки, при этом автору позволялось давать формальные определения каждому элементу и атрибуту языка. Таким образом, программисты имели возможность создавать свои собственные тэги, связанные с содержанием документа. В то время SGML был всего лишь одним из нескольких конкурирующих между собой подобных языков, однако популярность одного из его потомков - HTML - дала SGML неоспоримое преимущество перед своими собратьями.
Как язык SGML является очень мощным средством. Однако вместе с мощью пришла и сложность, поэтому все его широкие возможности используются редко. Кроме того, SGML-документ трудно интерпретировать без определения языка разметки, которое хранится в определении типа документа (Document Type Definition, DTD). В DTD сгруппированы все правила языка в стандарте SGML. DTD необходимо посылать вместе с SGML-документом или включать в документ для того, чтобы можно было распознать тэги, созданные пользователем. Языки разметки, созданные в стандарте SGML, известны как SGML-приложения.

Язык HTML


Первоначально язык HTML был всего лишь одним из SGML-приложений. Он описывал правила, по которым должна быть подготовлена информация для World Wide Web. Таким образом, язык HTML - это набор предписаний SGML, сформулированных в виде определения типа документа (DTD), которые объясняют, что именно обозначают тэги и элементы. В случае языка HTML, DTD хранится в браузере, оно описано во множестве книг, а также на нескольких Web-сайтах. По размеру язык HTML на много раз меньше языка SGML. В то же время он намного проще и  легок для изучения, что добавило ему популярности. Сейчас HTML принят во всех кругах компьютерного сообщества.
Язык HTML как способ разметки технических документов был создан Тимом Бернерсом-Ли (Tim Berners-Lee) в 1991 году специально для научного сообщества. С его помощью оказалось возможным значительно упростить организацию специальных текстов и передачу их через компьютеры различного типа. Идея состояла в создании набора особых словесных формул, которые можно было употреблять для разметки документов. Применение подобных формул должно было обеспечить передачу документов между компьютерами таким образом, чтобы адресаты могли воспроизводить документ в удобном формате. Например;
<Н1> Это заголовок первого уровня
<Н2> Это заголовок второго уровня

 Это текст, для которого важно сохранить форматирование
 <Р> Текст между этими тэгами образует абзац 
В те далекие времена представители научного сообщества почти не обращали внимания на внешний вид посылаемых и получаемых 
документов. Ученым было важно сохранить смысл передаваемого текста. Их не волновали такие мелочи, как цвет шрифта или точный
 размер заголовка первого уровня.
Для передачи информации по Internet язык HTML использует так называемый протокол передачи гипертекстов (Hypertext Transfer Protocol,
 HTTP). Это только один из протоколов, используемых в Internet, входящий в широко известный набор протоколов Internet (Internet Protocol 
Suite), который чаще называют TCP/IP. В настоящее время широко используются и несколько других протоколов из набора TCP/IP. До того
 как появился язык HTML, самым популярным был протокол передачи файлов (File Transfer Protocol, FTP).
Преимущество перед другими протоколами дала HTTP легкость, с которой он мог быть использован для подключения к другому документу.
 Объединение этого Протокола с простым для изучения языком обеспечило быстрое распространение систем, реализующих язык HTML и
 протокол HTTP.
Однако по мере того, как HTML приобретал все более широкое распространение и Web-браузеры становились все доступней, 
пользователи, не входившие в научное сообщество, стали в массовом порядке создавать свои собственные страницы. Эти представители
 «ненаучных» кругов все чаще начали обращать внимание на внешний вид своих материалов. Производители браузеров, используемых для
 просмотра Web-сайтов, с готовностью предлагали различные тэги, которые позволяли авторам Web-страниц представлять свои документы
 в куда более разнообразном виде, чем просто текст ASCII. Первой на этот путь встала компания Netscape, которая добавила знакомый 
нам тэг , позволявший пользователям менять как сами шрифты, так и их размер и ширину. С этого начался быстрый рост Числа тэгов, 
поддерживаемых браузерами.
С новыми тэгами пришли новые проблемы. Различные браузеры воспроизводили новые тэги по-разному. Сегодня существуют Web-сайты,
 на которых специально указывается: «Лучше всего просматривать в Netscape Navigator» или «Сделано дли Internet Explorer», и при всем
 этом от пользователей ожидают, что созданные ими Web-страницы будут похожи на документы, оформленные в самых совершенных 
настольных издательских системах  
Таким образом, потенциал браузера как новой платформы для приложений был признан очень быстро, и Web-разработчики 
приступили к созданию распределенных прикладных систем для бизнеса, используя Internet в качестве среды для получения 
информации и осуществления финансовых транзакций.
Недостатки языка HTML

В связи с широким распространением языка HTML все больший круг пользователей вовлекался в процесс написания HTML-приложений. Их усилия в первую очередь были направлены на увеличение числа и сложности операций, осуществляемых в Web. В результате скоро стали очевидны слабые места языка HTML, а именно:
• HTML имеет фиксированный набор тэгов. Вы не можете создавать свои тэги, понятные другим пользователям;
• HTML- это исключительно технология представления данных. HTML не несет информации о значении содержания, заключенного в тэгах;
• HTML-"плоский» язык. Значимость тэгов в нем не определена, поэтому нельзя представить иерархию данных;
• в качестве платформ для приложений используются браузеры. HTML не обладает достаточной мощью для создания Web-приложений на том уровне, к которому в настоящее время стремятся Web-разработчики. Например, на языке HTML достаточно сложно написать приложение для профессиональной обработки и поиска документов;
• большие объемы трафика сети. Существующие HTML-документы, используемые как приложения, засоряют Internet большими объемами трафика в системах клиент-сервер. Примером может служить пересылка по сети большой группы записей общего характера, в то время как необходима только небольшая часть этой информации.
Со временем усилиями пользователей, пытавшихся представить информацию в самых разнообразных формах, Web становилась все более и более фрагментированной. Создавая свои страницы, авторы пытались использовать не только разные реализации языка HTML, но и привлекали языки скриптов, динамический НТМL, каналы и другие технологии, которые оказались несовместимы с. многими браузерами.
Вот так  и случилось, что, с одной стороны, язык HTML являлся очень удобным средством разметки документов для использования в Web, а с другой - документ, размеченный в HTML, нес мало информации о своем содержании, и это  в то время, когда использование документа в деловых целях требовали серьезных знаний о его сути. Если тот или иной документ несет достаточно полную информацию о своем содержании, появляется возможность сравнительно легко провести автоматическую обобщенную обработку и поиск в файле, хранящем документ. Язык SGML позволяет сохранять информацию о содержании документа, однако вследствие особой сложности он никогда не использовался так широко, как HTML. Рассмотрим пример, насколько полезным может оказаться включение в документ информации о содержащихся в нем сведениях.
Представьте, что у вас есть библиотека компакт-дисков, размеченная в HTML и хранимая на Web-сервере. Если у вас появилось желание найти фонограмму определенного музыканта, вам придется загрузить библиотеку целиком, а затем произвести поиск по всем записям.

 

 

 

© Рефератбанк, 2002 - 2017