2.2 Forschungsdaten – Nutzung von Standards in den Geisteswissenschaften
2.1 Forschungsmethoden und -verfahren
In der geisteswissenschaftlichen Forschung ist die Erstellung von Metadaten Teil des Forschungsprozesses, um beispielsweise Forschungsquellen zu beschreiben, die als Quellengrundlage für die Beantwortung der Forschungsfragen dienen. Die Quellenkritik erzeugt Metadaten, die Auskunft über Provenienz, Glaubwürdigkeit und Aussagekraft einer Quelle geben. Diese im Forschungsprozess anfallenden Metadaten strukturiert und systematisch bereits beim Entstehen zu erfassen, bildet die Grundlage für eine Offenlegung für weitere Nutzergruppen. Die Nachnutzbarkeit von Forschungsdaten wird maßgeblich dadurch beeinflusst, ob diese auffindbar sind und die Bedingungen zur Nutzung der Forschungsdaten kenntlich gemacht sind. Erst die grobe Klassifizierung von Daten/Quellen mit Hilfe von Metadaten ermöglicht es, in der Vielfalt verfügbarer Objekte auf vergleichbares Material zu stoßen, das der Beweisführung der eigenen Forschungsthese dienen kann. Um die redundante Erfassung dieser Metadaten zu minimieren, ist zu empfehlen, die jeweils erzeugten Metadaten über die eigene Institution hinaus ortsunabhängig, ohne Zugangsbeschränkungen, in digitalisierter Form und maschinenauswertbar zur Verfügung zu stellen. Dabei stellt aufgrund der Vielzahl verwendbarer Formate die Interoperabilität von Metadaten zum jetzigen Zeitpunkt eine (technische) Herausforderung dar, die durch den Einsatz von internationalen Standards und Austauschformaten bisher am vielversprechendsten zu lösen scheint.
Jedoch zeigt die Konvertierung der eigenen Metadaten in diese Standards und Austauschformate einige Konsequenzen. Die Anpassung der Metadaten (Crosswalk, Harmonisierung) ist mit einem arbeitstechnischen Mehraufwand verbunden. In jedem Falle müssen Inkonsistenzen in den Altdaten zuvor beseitigt werden. Geht der Weg hin zu einem datenärmeren Format, beispielsweise Dublin Core, muss abgesichert werden, dass nicht für den Gegenstand wichtige Angaben verloren gehen. Wird umgekehrt in ein datenreicheres Format konvertiert, beispielsweise TEI, sind gegebenenfalls fehlende Pflichtangaben vorab zu ergänzen. Das nachfolgende Codebeispiel zeigt die relativ begrenzten Möglichkeiten der Metadatenvergabe mit Hilfe des Dublin Core Metadata Element Set(1), in dem 15 verschiedene Metadatenelemente angegeben werden können.
<html xmlns="http://www.w3.org/1999/xhtml">
<head>
<meta content="text/html; charset=utf-8" http-equiy="Content-Type"/>
<title>Carl Maria von Weber für Elise Vigitill [Stammbuchblatt]. Nürnberg, 10. September 1792</title>
<link rel="schema.DC" href="http://purl.org/dc/elements/1.1"/>
<link rel="schema.DCTERMS" href="http://purl.org/dc/terms"/>
<meta name="DC.creator" content="Peter Stadler"/>
<meta name="DC.date" content="2011-05-31T16:3:00+01:00" scheme="DCTERMS.W3CDTF"/>
<meta name="DC.publisher" content="Carl-Maria-von-Weber-Gesamtausgabe"/>
<meta name="DC.type" content="Text" scheme="DCTERMS.DCMIType"/>
<meta name="DC.format" content="text/html" scheme="DCTERMS.IMT"/>
<meta name="DC.contributor" content="Weber, Carl Maria von"/>
<meta name="DC.contributor" content="Veit, Joachim"/>
<meta name="DC.identifier" content="https://euryanthe.de/wega/de/A002068/Korrespondenz/A040043" scheme="DCTERMS.URI"/>
<meta name="DC.title" content="Carl Maria von Weber für Elise Vigitill [Stammbuchblatt]. Nürnberg, 10. September 1792"/>
<meta name="description" content="Stammbucheintrag für Elise Vigitill, "im Uten Jahr seines Alters" (Blatt mit Bleistift vorliniert);" lang="de"/>
<meta name="DC.subject" content="ego-document"/>
<meta name="DC.language" content="de" scheme="DCTERMS.RFC3066"/>
<metad name="DC.rights" content="All rights reserved"/>
</head>
<body/>
</html>
Metadatenangabe mit Dublin Core (mit weitgehend selbsterklärenden Attributnamen)
MitarbeiterInnen müssen zugleich in der Anwendung des neuen Standards geschult werden. Gerade dieser Aspekt ist nicht zu unterschätzen, denn primär sind WissenschaftlerInnen darauf fokussiert, Daten für die eigene Forschung zu erheben. Eine Nachnutzung bereits existierender Forschungsdaten ist in den Geisteswissenschaften bisher nicht üblich. Gegenwärtig arbeiten vorrangig Museen, Bibliotheken und Archive an der Entwicklung bzw. Weiterentwicklung von Standards. Durch die Standardisierung sollen hier Informationen für externe NutzerInnen bereit gestellt werden, die Gegenstände leichter wiederauffindbar machen, wodurch vor allem dem Servicegedanken Rechnung getragen wird, Zugänge zu vereinfachen. Forschungsrelevante Informationen werden in diesen Standards zwar auch erfasst, jedoch wird die Verfeinerung der Datenstrukturen nicht gezielt nach Forschungsinteressen fortgeführt.
Ein weiteres Problem für die Nutzung stellt die laufende Aktualisierung von Standards und Formaten dar, die durch veränderte Forschungsmethoden nötig wird. Veränderungen in Standards führen immer auch zur Notwendigkeit der Überarbeitung von Altdaten, damit diese mit neu erzeugten vergleichbar bleiben.
Standards werden in der Regel anwendungsorientiert entwickelt. Erstrebenswert ist deshalb meist nur der gegenseitige Austausch jener Ausschnitte aus Datenstrukturen, bei denen Überschneidungen im Arbeitsprozess bzw. der Forschungsmethode auftreten, d.h. allein das Filtern und Mappen von relevanten Daten auf den eigenen Standard bzw. das Metadatenformat als Arbeitsgrundlage ist von Interesse. DARIAH-DE entwickelt eine sog. Schema Registry, die es Forschern ermöglichen wird, mittels Crosswalks Daten aus verschiedenen Quellformaten in ein gewünschtes neues Format zu konvertieren. Voraussetzung für solche Crosswalks sind jedoch definierte Standards für Forschungsdatensammlungen.
Die Erfassung und Erschließung von geisteswissenschaftlichen Forschungsdaten und deren digitale Bereitstellung und Anreicherung mit Norm- und Metadaten – die technische Grundbedingung einer interoperablen Nachnutzung – spielten in der Vergangenheit für geisteswissenschaftliche Forschungsprojekte nur eine periphere Rolle. Insbesondere geisteswissenschaftliche Forschungseinrichtungen – ob außeruniversitär oder universitär –, aber auch größere Forschungsprojekte und -verbünde, wie sie beispielsweise in den letzten Jahren durch die Exzellenzinitiative oder auch durch die Sonderforschungsbereiche (SFB) der DFG in Deutschland gefördert wurden, zeigten in diesem Bereich der Standardisierung kaum nennenswerte Aktivitäten. Dies lag und liegt einerseits daran, dass oftmals die digitale Erschließung und Metadatenverzeichnung von Forschungsdaten nicht Bestandteil von Forschungsbewilligungen waren und forschungszentrierte Projekte fast ausschließlich an ihren unmittelbaren Forschungsergebnissen gemessen wurden und werden. Zudem – und dies ist ein zentraler Unterschied zu den Sozialwissenschaften – werden geisteswissenschaftliche Forschungsdaten entweder nur in bestimmten Disziplinen, wie z.B. der Archäologie, durch WissenschaftlerInnen selbst erhoben, oder im Rahmen von Langzeitprojekten – diese sind fast ausschließlich an Akademien angesiedelt –, die sich auf ausgewählte Quellenkorpora und Forschungsdaten-Collections fokussieren. Darüber hinaus wird die Erfassung von Forschungsdaten per se nicht als integraler Bestandteil des wissenschaftlichen Forschungsprozesses betrachtet und es besteht in verschiedenen geisteswissenschaftlichen Disziplinen zurzeit nur eine geringe Akzeptanz, solche Arbeiten und Leistungen, die gerade im Rahmen von klassischen Forschungsprojekten entstehen könnten, als wissenschaftliche Leistung von EinzelforscherInnen anzuerkennen. Dies sind Aspekte, die sich in den kommenden Jahren rasant verändern müssen, da die Forschungsförderung in der Bundesrepublik Deutschland, aber auch z.B. die Europäische Kommission, durch eine sich verändernde Forschungspolitik hierauf bereits jetzt reagieren.(2) Gerade die Erfassung von Forschungsdaten, deren Anreicherung mit Metadaten und der interoperable und nicht auf einzelne Forschungsfragen und -kontexte fokussierte Zweitzugriff und die Nachnutzung durch andere GeisteswissenschaftlerInnen bilden letztlich eine der zentralen Säulen von Verfahren und Methoden der Digital Humanities.(3)
Wie bereits zuvor angesprochen, hat die hier vorliegende Studie nicht das Ziel, eine verbindliche und unbedingt einzuhaltende Nutzungsempfehlung bzgl. der Verwendung von Metadatenstandards bzw. von Normdaten zu geben. Sie versteht sich vielmehr als Evaluation bestehender Entwicklungen der vergangenen Jahre in den unterschiedlichen geisteswissenschaftlichen Fachdisziplinen und möchte zugleich geisteswissenschaftlich Forschende bei der Wahl von spezifischen disziplinären oder generisch interdisziplinären Metadatenformaten unterstützen.
2.3 Dokumentation der Forschungsergebnisse – Administrative Metadaten
-
Für weiterführende Informationen zu den einzelnen Elementen des DC Standards siehe: http://dublincore.org/documents/dces/ ↩
-
Vgl. hierzu Horizon 2020, http://ec.europa.eu/research/horizon2020/index_en.cfm?pg=home&video=none oder auch die Empfehlung zur Weiterentwicklung der Forschungsinfrastrukturen in Deutschland bis 2020, die im Juli 2012 vom Wissenschaftsrat herausgegeben wurde: http://www.wissenschaftsrat.de/download/archiv/2359-12.pdf ↩
-
Vgl. hierzu den DARIAH-DE-Report R 2.2.3 vom 31. August 2012. Erster Bericht über die Verfahren der Digital Humanities in den Geistes- und Kulturwissenschaften. https://dev2.dariah.eu/wiki/download/attachments/2295542/M223_DH-Verfahren.pdf?version=1&modificationDAte=1347378358954 ↩