Издательский дом ООО "Гейм Лэнд"СПЕЦВЫПУСК ЖУРНАЛА ХАКЕР #52, МАРТ 2005 г.

БД и XML

Ижевский Виталий Григорьевич

Спецвыпуск: Хакер, номер #052, стр. 052-066-5


XPath (XML Path Language) – выражения, описывающие местоположение элемента/элементов в XML-документе. Это немного напоминает URL или файловый путь. Например: //department/employee – все элементы employee в документе с предком department. Таким образом с помощью XPath можно быстро добраться до любого элемента.

XSL (Extensible Stylesheet Language) – набор правил-шаблонов, описанных в формате XML для преобразования одного синтаксически правильного XML-файла в другую структуру. Парсер поочередно обходит все узлы дерева XML и на основе шаблонов строит результирующий документ.

Пример XSL-шаблона:

Выражение Xpath department/employe используется для указания элемента, к которому нужно применить нужный шаблон. А в строчке xmlns:xsl="http://www.w3.org/TR/WD-xsl" символы xmlns:xsl дают указания парсеру, что в элементе xsl:stylesheet будет использоваться язык xsl, уникальность которого гарантируется уникальностью URL http://www.w3.org/TR/WD-xsl (два документа, которые имеют одинаковое пространство имен, должны иметь одинаковый возможный набор элементов). Все теги этого языка должны начинаться префиксом xsl с последующим двоеточием и названием тега. Этот принцип называется пространством имен. Такие правила описываются с помощью языка DTD (Document Type Definition). Можно указать в своем XML-файле ссылку на DTD-файл, и тогда парсер автоматически будет проверять данные на соответствие нужной структуре. При использовании большой программной системы (несколько разработчиков) наличие DTD даст возможность просто и доступно указать формат XML-файлов.

XML – это упрощенный SGML.

Формат XML понимает и обрабатывает парсер, работая согласно спецификациям.

Наиболее используемые парсеры: libxml и msxml (libxml для Linux).

В поставку MS Office 2003 входит MSXML версии 5. Этот парсер использовать категорически не рекомендуется, так как это какая-то недоработка и тупиковая ветвь (неизвестно, почему четвертую версию Microsoft выпустила после релиза пятой).

Язык XML - мультинациональный, но поддержка кодировок и языков зависит от используемого парсера.

XML позволяет расширить возможности реляционной БД, но из-за своих недостатков вряд ли сможет заменить ее.

Назад на стр. 052-066-4  Содержание