| |
1 Einführung in XML
1.1 Motivation
Die XML (Extensible Markup Language) ging 1998 aus der bereits 1986 veröffentlichten SGML
(Standard Generalized Markup Language) hervor. SGML beschreibt einen Standard, der zwar sehr
mächtig ist, aber aufgrund seiner komplexen Syntax sehr unhandlich für das Internet und daher für den
Datenaustausch nicht geeignet ist. Aufgrund der Leichtigkeit, mit der man HTML (Hypertext Markup
Language) erlernen und anwenden kann, hat sich HTML zur Standardsprache im Web entwickelt.
Dabei hat HTML einige Nachteile, wie die beschränkte Anzahl von Tags oder auch die nicht
vorhandene Trennung von Inhalt und Darstellung. XML sollte nun eine Sprache sein, die die Vorteile
von HTML und SGML vereint. Mit ihr wird die Struktur der Daten vom Inhalt getrennt, wodurch sich
XML gut zum standardisierten Datenaustausch eignet. Dies wird durch das Deklarieren eigener
semantischer Strukturen (DTD/XMLSchema) unterstützt. Zur Darstellung des Inhalts können andere
Tools, wie XSL (Extensible Stylesheet Language) benutzt werden.
Die Daten, die in XML beschrieben werden, werden als semistrukturiert bezeichnet, das heisst, es sind
Daten, die nicht streng typisiert sind. Zum Beispiel sind Daten aus relationalen Datenbanken fest
typisiert, damit sie in das Schema aus Tabellen passen. Bilder oder Klänge sind dagegen völlig
untypisiert, sie besitzen keine Struktur. Zwischen diesen beiden Extrema liegen die semistrukturierten
Daten.
1.2 Aufbau
1.2.1 Syntax
Ein XML-Dokument besteht im wesentlichen aus sogenannten Tags und den Informationen. Dabei
können, wie oben erwähnt, eigene Tags durch <eigener_Tag> definiert werden. Solch ein Tag muss
durch </eigener_Tag> auch wieder geschlossen werden. Mit dem Tag können auch Attibute, die sich
auf dieses Tag beziehen, angegeben werden. Die folgende XML-Datei bib.xml zeigt den
wesentlichen Aufbau eines XML-Dokuments. Das Dokument wird in der ganzen Ausarbeitung
benutzt, um die einzelnen Konzepte an den entsprechenden Stellen zu erläutern.
<?xml version=1.0?>
<!DOCTYPE bib SYSTEM "bib.dtd">
<bib>
<item typ=Buch id="1-55860-622-X">
<titel>Data on the Web</titel>
<autor>Abiteboul</autor>
<autor>Buneman</autor>
<autor>Suciu</autor>
<jahr>1999</jahr>
</item>
<item typ=Buch id="1-XXXXX-YYY-Z">
<titel>XML Query</titel>
<autor>Fernandez</autor>
<autor>Suciu</autor>
<jahr>2001</jahr>
</item>
<item typ=Magazin id="1234">
<titel>ct</titel>
<redakteur>Heise</redakteur>
<jahr>2001</jahr>
</item>
</bib>
3
|  |
|
| |
|
|