4.3 Ortsbeschreibung und Georeferenzierung

4.2 Datierung

Die Standardisierung von Ortsbeschreibungen in den Geisteswissenschaften unterliegt mehreren Problemstellungen. So verändern sich Ortsnamen über die Zeit, durch Sprachwandel oder Umbenennung. Orte werden aufgrund von Verschiebungen der Kulturgrenzen oder Änderungen in der Staatsform und -organisation unterschiedlichen administrativ-politischen Verbünden zugewiesen. Eindeutig kann eine Ortsbeschreibung nur über ein Zuordnungssystem mit Geokoordinaten erfolgen. Aus Sicht der Quellengrundlage stellen verschiedene Schreibweisen und Sprachvarianten von Ortsbezeichnungen in historischen Quellen eine Herausforderung für die maschinelle Auswertung dar. Gerade auch in der Archäologie muss ein Fundort keine spezifische Ortsbezeichnung in Form eines Namens aufweisen, sondern lässt sich mitunter nur über Geokoordinaten erfassen. Die Darstellung von Georeferenzen durch topografische und thematische Karten ist eine weitere Variante, die gerade bei historischen Karten keiner standardisierten Form unterliegt. Exaktes Georeferenzieren in historischen Karten ist häufig weniger von Bedeutung, vielmehr ist die auf einen bestimmten Forschungskontext bezogene Veranschaulichung von kulturellen, religiösen, politischen, wirtschaftlich relevanten Bezügen zentraler Punkt für die Gestaltung. Häufig lässt sich an der einfachen Ortsbeschreibung nicht erkennen, in welchem Kontext die Ortsangabe zu lesen ist, ob als Aufbewahrungsort eines Objektes, Fundort, historischer Ort o.ä. Dies erschwert es, Daten zu Ortsnamen und Georeferenzen aus verschiedenen Quellsystemen und -formaten in Beziehung zueinander zu setzen und sie in automatisierter Weise zu analysieren(1).

Wenn Geokoordinaten die genaueste Erfassung von Ortsbezeichnungen darstellen, welche Koordinatensysteme gibt es dann? Das Gauß-Krüger-Koordinatensystem ist ein kartesisches Koordinatensystem und wurde im 19. Jh. von Carl Friedrich Gauß und Johann Heinrich Louis Krüger entwickelt. Diesem Standard unterliegen die meisten Katasterpläne. Heute weit verbreitet ist die Nutzung des WGS84 – World Geodetic System 1984, das jedoch zunehmend durch UTM – Universal Transverse Mercator als Standard ersetzt wird; beide Standards basieren auf einem Rasterdatenmodell.

<history>
   <origin>
      <date notBefore="1790-05-21">1790-05-21</date>
      <country type="ISO_3166" key="XA-DE-BY">Germany
         <region>Bavaria</region>
      </country>
      <settlement type="TGN" key="7004326">Bayreuth
         <geogName>Cemetery, Jewish
            <geo>49.934064 11.594224</geo>
         </geogName>
      </settlement>
   </origin>
</history>

Auszug aus einem TEI-Header mit Referenz aus ISO 3166, TGN und WGS84 (zu den Abkürzungen vgl. nachfolgende Erläuterungen)

Normdaten und Thesauri bieten eine Möglichkeit, verschiedene für die Ortsbeschreibung und Georeferenzierung benötigte Informationen miteinander zu verknüpfen. Welche Vokabulare stehen zur Verfügung bzw. sind besonders häufig in Gebrauch?

ISO 3166 ist eine internationale Norm von zwei- und dreibuchstabigen Länderkürzeln, die aus drei Teilen besteht. Der erste Teil ISO 3166-1 ist für aktuelle Staaten, der zweite Teil ISO 3166 -2 für Untereinheiten von Staaten und der dritte Teil für auslaufende Länderkürzel von historischen Staaten seit 1977.

Getty Thesaurus of Geographic Names Online (TGN) ist ein Thesaurus des J. Paul Getty Trust, der sowohl aktuelle als auch historische Bezeichnungen in verschiedenen Sprachen hierarchisch abbildet und für die Anwendung in der Museumsdokumentation entwickelt wurde. Er enthält ca. 1.106.000 Datensätze, die 91.200 Orte beschreiben. Des weiteren beinhaltet der Thesaurus zusätzliche Informationen zu den erfassten Orten wie ungefähre Geokoordination oder eine Kategorisierung nach Ortstyp, und er unterscheidet außerdem zwischen geophysischen und geopolitischen Datensätzen. Der Thesaurus ist zurzeit noch lizenzpflichtig. Ab Juli 2014 steht der TGN jedoch als open metadata zur Verfügung.

DARIAH-DE bietet mit dem Getty Thesaurus of Geographical Names REST Service ein Werkzeug an, mit dem sich TGN-IDs schnell ermitteln lassen.

Beispiel: Der Parameter ac (autocompletion) bietet eine Liste sämtlicher Ortsnamen, die wie im folgenden Beispiel mit "goet" beginnen: http://ref.dariah.eu/tgnsearch/tgnquery.xql?ac=goet.

Der Parameter ln (long) liefert ausführliche Informationen zu einem Ort: http://ref.dariah.eu/tgnsearch/tgnquery.xql?ln=Berlin.

Ebenso können mit einer bekannten TGN-ID über den Parameter id sämtliche Informationen zu dem betreffenden Ort abgerufen werden: http://ref.dariah.eu/tgnsearch/tgnquery.xql?id=7004325.

Virtual International Authority File (VIAF) wird vom OCLC (Online Computer Library Center) gehostet und ist ein Gemeinschaftsprojekt einiger Nationalbibliotheken zur Zusammenführung ihrer Normdateien. Geonormdaten werden hier ebenfalls miteinander verknüpft und sind somit in mehrsprachiger Übersetzung vorhanden. VIAF unterstützt auch nichtlateinische Schriften wie Hebräisch, Kyrillisch und Arabisch.

2007 wurde die Direktive Infrastructure for Spatial Information in the European Community (INSPIRE) durch die Europäische Kommission in Kraft gesetzt. Ziel ist es, eine Geodateninfrastruktur zu schaffen, die Zugang zu sämtlichen Geodaten staatlich öffentlicher Einrichtungen gewährleistet. Auf europäischer Ebene erarbeitet die Koordinierungsstelle Europäische Geodateninfrastruktur ESDI Richtlinien, die von nationalen Koordinierungsstellen in den jeweiligen Ländern umgesetzt werden, für Deutschland die Geodateninfrastruktur Deutschland (GDI.DE). INSPIRE unterstützt den offenen Standard GML vom Open Geospatial Consortium (OGC). Die INSPIRE Datenspezifikationen definieren auch ein application profile for Protected sites. Protected sites sind unter anderem "menschengemachte Objekte" wie Architektur und archäologische Stätten oder kulturelle Objekte. Bis 2019 sollen die INSPIRE Richtlinien implementiert sein und Geodaten, die diesen Richtlinien entsprechen, stehen dann Forschern für die Nachnutzung zur Verfügung.

KML – Keyhole Markup Language, ist eine Auszeichnungssprache für Geodaten. KML ist ein Standard des OGC und wird u.a. von GoogleEarth und GoogleMaps sowie dem DARIAH-Geobrowser unterstützt.

<?xml version="1.0" encoding="UTF-8" standalone="yes"?>
<kml xmlns="http://www.opengis.net/kml/2.2"
   xmlns:gxhttp://www.google.com/kml/ext/2.2"
   xmlns:atom="http://www.w3.org/2005/Atom"
   xmlns:kal="urn:oasis:names/tc.ciq:xsdschema:xAL:2.0">
   <Folder>
      <Placemark>
         <name>Jüdischer Friedhof Adelebsen, In Steilhang</name>
         <address>Adelebsen</address>
         <TimeStamp>
            <when>1733</when>
         </TimeStamp>
         <Point>
            <coordinates>9.74058,51.575771</coordinates>
         </Point>
      </Placement>
   </Folder>
</kml>

Ausschnitt einer aufbereiteten KML-Datei für das DARIAH spatio-temporal interface (Geobrowser)

GeoNames ist eine Datenbank mit derzeit 10 Millionen geografischen Namen in verschiedenen Sprachen, mit Angabe von Längen- und Breitengrad, Höhe über dem Meeresspiegel, Einwohnerzahl, administrative Unterteilung und Postleitzahlen. Alle Koordinaten verwenden WGS84. Die Daten von GeoNames sind unter der Creative Commons Lizenz Namennennung veröffentlicht und können somit frei nachgenutzt werden.

Iconclass ist eine Klassifikation für die Erfassung von Bildinhalten, auch Ideallandschaften, mythologischen Orten etc., siehe Abschnitt Objektinformationen.

Im Getty Thesaurus of Geographic Names werden nur ungefähre Angaben für die Referenzierung mit Koordinaten vorgenommen. Die meisten Thesauri gehen zudem nicht bis auf die Ebene von Gebäuden, Straßen oder gar Punkten. Lediglich INSPIRE wird dies zukünftig zumindest für Protexted Sites-Inhalte bereitstellen. Um diese Lücke zu schließen, entwickeln Projekte, die im Umfeld der Digital Humanities entstehen, neue Formen von Gazetteers (Ortsverzeichnissen). Ein Beispiel für einen solchen Gazetten ist Pleiades. Pleiades ermöglicht es Forschern weltweit, ihre historischen geographischen Informationen auf dieser Plattform zu veröffentlichen und in digitaler Form zu teilen. Derzeit liegt der Fokus auf Ortsinformationen der griechisch-römischen Antike, jedoch weitet sich das Angebot zunehmend auch auf Informationen zu vorderasiatischer, byzantinischer, keltischer und mittelalterlicher Geographie aus und umfasst auch Angaben zu Gebäuden, Denkmälern und Fundplätzen menschlicher Aktivität, die keinen eigenen Ortsnamen haben, sowie mythologischen Orten. Pleiades ist spezialisiert und damit nur für bestimmte Geisteswissenschaften im Umfeld der Klassischen Archäologie und Alten Geschichte interessant, deckt aber dafür die Bedürfnisse dieser Wissenschaften besser als Universalklassifikationen ab.

Auch im Bereich der Georeferenzierung von historischen Karten entstehen neue Werkzeuge(2), die es ermöglichen, Bilddaten zu georeferenzieren und Punktdaten zu gewinnen.

Durch die weite Verbreitung und Übersetzung in unterschiedlichen Sprachen bieten internationale Standards und Universalklassifikationen zur Ortsbeschreibung gerade im Hinblick auf multilinguale Interoperabilität Vorteile, jedoch sind sie häufig nicht feingranular genug, um alle Anforderungen in der Forschung abzudecken.

4.4 Personeninformationen


  1. Exemplarisch für den Aufwand, der für die Zusammenführung aller benötigten Daten für eine teilautomatische Analyse notwendig ist, sei hier auf das Kapitel 3.2 “Collection and mapping of archaeological data” hingewiesen in: Mayke Wagner, Pavel Tarasov, Dominic Hosner, Andreas Fleck, Richard Ehrich, Xiaocheng Chen, Christian Leipe, “Mapping of the spatial and temporal distribution of archaeological sites of northern China during the Neolithic and Bronze Age”, in: Quaternary International, available online 2 July 2012, http://dx.doi.org/10.1016/j.quaint.2012.06.039

  2. Im Palantir Blog wird eine Methode basierend auf Quantum GIS beschrieben, http://www.netpalantir.it/news/index/how-to-georeference-an-image. Quantum GIS ist ein open source Geoinformationssystem. Der webbasierte Georeferencer.org erlaubt das Bookmarken von historischen Karten aus dem Netz, in denen dann manuell einige Punkte markiert und mit Punkten an demselben Ort in Google-Maps verknüpft werden. Anschließend wird automatisiert ein KML-File erzeugt, mit dem weitere Funktionen von Georeferencer.org arbeiten (Genauigkeitsgradbemessung von historischen Karten etc.).