[Tustep-Liste] XML-Daten importieren

Thomas Kollatz t.kollatz at steinheim-institut.de
Fri Nov 25 15:55:37 CET 2005


Lieber Herr Schälkle, 
Sie haben nichts falschgemacht ...

Die Datei *.odt ist ein Ziparchiv (in OO1.1 war das die *.sxw Datei). 
Unziped findet sich die xml-Datei in content.xml. 

Vielleicht liefert auch die Funktion "DATEI - EXPORTIEREN", und der 
Export ins Dateiformat xhtml ein brauchbares Ergebnis.


Herzliche Grüsse
THOMAS KOLLATZ

>
>ich habe mit Openoffice 2.0 folgenden Text geschrieben:
>  Das #1+ist#1- #f+ein#f- #/+kursiver#/- Test.
>Um Missverstaendnissen vorzubeugen:
>"ist" war unterstrichen, "fett" war fett und
>"kursiver" war kursiv dargestellt.
>
>Vermutlich habe ich dabei etwas
>falsch gemacht. In den ersten beiden Faellen
>war der Text "Das ist ein kursiver Test." leicht
>zu finden, aber ohne jegliche Auszeichnungen.
>Im letzten Fall erhielt ich eine Datei, die eher
>nach einer Binaerdatei aussah, von XML-Tags
>keine Spur.
>
>Was muss ich beim Abspeichern beachten, damit
>die Auszeichnungen nicht verloren gehen, bzw.
>eine "lesbare" Datei mit XML-Tags entsteht?
>


Auszug aus der OpenOffice20 Hilfe: 

Aufbau der XML-Datei
Dokumente im Open Office-Dateiformt werden als komprimierte Zip-Archive 
mit XML-Dateien gespeichert. Zum Anzeigen dieser XML-Dateien können Sie 
die Open Office-Datei mit einem Dekomprimierungsprogramm öffnen. In den 
Open Office-Dateien sind die folgenden Dateien und Verzeichnisse 
enthalten:
Der Text-Inhalt des Dokuments steht in content.xml.
Standardmäßig wird content.xml ohne Formatierungsattribute wie 
Einrückungen oder Zeilenumbrüche gespeichert. Dies spart Zeit beim 
Speichern und Öffnen des Dokuments. Unter Extras - Optionen - 
Laden/Speichern - Allgemein können Sie die Verwendung von Einrückungen 
und Zeilenumbrüchen aktivieren, indem Sie das Häkchen aus dem Markierfeld 
XML-Format auf Größe optimieren (ohne Pretty Printing) entfernen.
Die Datei meta.xml enthält die Meta-Informationen zum Dokument, die unter 
Datei - Eigenschaften eingegeben werden können.
Wenn Sie ein Dokument mit einem Passwort speichern, wird das ganze 
Dokument bis auf die meta.xml verschlüsselt.
In der Datei settings.xml sind weitere Informationen über die 
Einstellungen dieses Dokuments gespeichert.
In styles.xml sind die auf das Dokument angewendeten Formatvorlagen 
enthalten, die Sie im Stylisten sehen.
Die Datei meta-inf/manifest.xml beschreibt die Struktur der XML-Datei.
Im gepackten Dateiformat können noch weitere Dateien enthalten sein. 
Beispielsweise könnten ein Unterverzeichnis Bilder mit Grafiken, ein 
Unterverzeichnis Basic mit Basic-Code und weiteren Unterverzeichnissen 
vorhanden sein, die verknüpfte Basic-Bibliotheken enthalten.

... 

In der Standardeinstellung lädt und speichert OpenOffice.org Dateien im 
Open Office-Dateiformat.

Beim Open Office-Dateiformat handelt es sich um ein von OASIS 
(Organization for the Advancement of Structured Information Standards) 
standardisiertes XML-Dateiformat.

Namen der XML-Dateiformate
OpenOffice.org arbeitet mit den folgenden XML-Formaten:
Anwendung
Dateierweiterung
Open Office-Text *.odt
Open Office-Textdokumentvorlage *.ott
Open Office-Globaldokument *.oom
HTML-Dokument *.html
HTML-Dokumentvorlage *.oth
Open Office-Tabellendokument *.oos
Open Office-Tabellendokumentvorlage *.ots
Open Office-Zeichnung *.ood
Open Office-Zeichendokumentvorlage *.otd
Open Office-Präsentation *.oop
Open Office-Präsentationsdokumentvorlage *.otp
Open Office-Formel *.oof
Open Office-Datenbank *.odb

n habe ich die Daten mit "Speichern unter" als
>- Microsoft Word 2003 XML
>- DocBook
>- OpenDocument Text
>Mit herzlichen Gruessen
>Kuno Schaelkle
>
>------------------------------------------------------------
>Tustep-Liste at itug.de
>https://lists.uni-wuerzburg.de/mailman/listinfo/tustep-liste
>

-- 
drs Thomas Kollatz - wissenschaftlicher Mitarbeiter / research assistant
Salomon Ludwig Steinheim-Institut fuer deutsch-juedische Geschichte
D - 47057 Duisburg, Geibelstrasse 41, Tel: 49-203-370071
www.steinheim-institut.de/das_institut/mitarbeiter/kollatz/index.xml



More information about the Tustep-Liste mailing list