Einführung in das Open XML-Format - WordML im Überblick
Die Office-Anwendungen Excel, PowerPoint und Word verwenden jeweils ihr eigenes XML-Vokabular für die Darstellung eines Dokuments, das ExcelML, PowerPointML und WordML heißt, wobei "ML" jedes Mal für "Markup Language" steht. Word-PowerUser werden sich in Zukunft zu mindestens in Grundzügen mit WordML auskennen müssen, denn ist die Grundlage dafür, Word-Dokumente außerhalb des Office-Pakets zu erstellen.

» Von , 03.06.2009 19:43. Letztes Update, 03.06.2009 19:44.
Die Struktur eines Dokuments spiegelt sich im Aufbau des jeweiligen Vokabulars wieder. Eine Word-Datei enthält immer nur eine Dokumentenebene, das Dokument selbst. Bei Excel gibt es Arbeitsmappen (Workbooks), die wiederum einen Container für Tabellenblätter (Sheets) oder Diagramme (Charts) darstellen, selber aber keine anderen wesentlichen Informationen enthalten. Der Dokumentaufbau ist daher bei Word einfacher und mit weniger Beziehungen behaftet.
WordML - Word 2007-Dokumente 100% in XML dargestellt
Das oberste Element eines Word-Dokuments ist (natürlich) <document>. Darauf folgt das Element <body>, an den sich der Inhalt des Dokuments anschließt. Was auch manche erfahrenen Anwender nicht unbedingt wissen, ein Word-Dokument besteht aus einer Aneinanderreihung von Absätzen, die durch Paragraph-Elemente (
) repräsentiert werden. In einem Absatz gibt es mindestens eine Zeichenfolge mit identischer Formatierung, der sog. Run
(<r>). Der Text, um den es in der Regel geht, ist Teil des Text-Elementes (<t>). Listing 1 zeigt den Aufbau des wohl denkbar einfachsten Word-Dokuments im WordML-Format.
<w:document xmlns:w="http://schemas.openxmlformats.org/wordprocessingml/2006/main">
<w:body>
<w:p>
<w:r>
<w:t>Einfachstes denkbares Dokument</w:t>
</w:r>
</w:p>
</w:body>
</w:document>
Listing 1: Das vermutlich einfachste WordML-Dokument der Welt
Der Umstand, dass der Texte eines Absatz in einem Run-Abschnitt untergebracht ist, hat einen einfachen Grund: Es wird dadurch einfacher, Formatierungen zuzuweisen. Jeder halbwegs erfahrene Word-Anwender weiß, dass bei Word zwischen direkter Formatierung und der indirekten Formatierung durch das Einbeziehen von Formatvorlagen (Styles) unterschieden wird. Direkte Formatierungen, wie z.B. die Fettschrift eines Wortes, werden an Ort und Stelle im <run>-Element definiert (Listing 2).
<w:r>
<w:rPr>
<w:b/>
<w:i/>
<w:color w:val="FF0000"/>
<w:lang w:val="de-CH"/>
</w:rPr>
<w:t>ein erweiterbarer Standard</w:t>
</w:r>
Listing 2: Ein Absatz mit direkter Formatierung
Der Text in Listing 2 wird in roter, kursiver Fettschrift ausgegeben und für die Rechschreibprüfung wird die Information hinterlegt, dass es sich um die Sprache Deutsch in der Kultur Schweiz handelt. Diese Formatierungen werden auf den folgenden Text angewandt. Der etwas ungewöhnlich wirkende Farbwert ist ein RGB-Wert in Hexadezimalschreibweise (FF0000 = Rot-Anteil 255, Grün-Anteil 0, Blau-Anteil 0), der in der Open XML-Dokumentation [1] beschrieben wird und über den Open XML Class Explorer aus dem Open XML SDK abgerufen werden kann [2].



KOMMENTARE
KOMMENTAR SCHREIBEN