Links: Entnahme von Wasserproben mit einer CTD-Rosette unter Aufsicht von Thorsten Dittmar vom MPI für marine Mikrobiologie in Bremen; Rechts: Meteorologische Messungen auf einer Wetterstation bei Jena mit Ökosystemdaten durch Markus Reichstein vom MPI für Biogeochemie

Langzeitarchivierung (dLZA) von Forschungsdaten


Was ist das und warum?

Gemäß der verbindlich für den MPG e.V. geltenden „Guten Wissenschaftlichen Praxis“ (GWP), sind Forschungsdaten sowie Forschungsergebnisse lesbar vorzuhalten. Dies gilt i.d.R. für einen Zeitraum von 10 Jahren. Darüber hinaus sieht die GWP die weitere Aufbewahrung von einer Auswahl aussagekräftiger Forschungsdaten im Rahmen einer Langzeitarchivierung vor (vgl. GWP, S. 13f).

Die Langzeitarchivierung von Forschungsdaten meint hier das Erhalten der technischen und semantischen Lesbarkeit von archivwürdigen Forschungsdaten über einen unbestimmt langen Zeitraum (mindestens mehrere Hard- und Softwaregenerationen). Sie zielt dadurch insbesondere auf eine langfristig mögliche Nachnutzung dieser Daten durch unterschiedliche Disziplinen aller daran Interessierten ab (§8 Abs. 1, Statut AMPG).

 

Übernimmt das Archiv der MPG Forschungsdaten?

Das Archiv bietet den Instituten der MPG eine solche Langzeitarchivierung digitaler Forschungsdaten an, sofern keine disziplineigenen oder generell geeigneten Lösungen für einen Langzeiterhalt bestehen. Für diesen Zweck betreibt das Archiv ein digitales Langzeitarchiv für die dauerhafte, d.h. zeitlich unbegrenzte Archivierung digitaler Informationen gemäß geltender Standards (OAIS-Referenzmodell: ISO 14721:2012). Die physische Datenspeicherung erfolgt ausschließlich in den MPG-eigenen Rechenzentren bei der MPCDF (Garching) und dem GNZ (Berlin), sodass die MPG stets die Datenhoheit behält. Gemäß seines Statuts steht der Zugang zu diesen digitalen – wie auch zu allen anderen vom Archiv der MPG aufbewahrten Unterlagen – jedem auf Anfrage und im Rahmen der Rechtlichen Möglichkeiten (v.a. Urheberrecht, Datenschutz) offen.

 

Zeitpunkt

Eine Langzeitarchivierung von Forschungsdaten beginnt spätestens mit Ablauf definierter Aufbewahrungsfristen (häufig 10 Jahre nach Publikation der zugehörigen Forschungsergebnisse). Aus organisatorisch-technischen Gründen kann sie aber auch zu anderen, früheren Zeitpunkten sinnvoll sein. Fragen der Haltbarkeit der Daten, gewünschte Nachnutzungen oder organisatorische Gründe sollten berücksichtigt werden. Der genaue Zeitpunkt für eine Langzeitarchivierung ist so früh wie möglich in Absprache von der Forschung und dem Archiv der MPG, zu definieren.

 

Für welche Forschungsdaten kommt eine Langzeitarchivierung in Frage?

Die Langzeitarchivierung von Forschungsdaten beschränkt sich i.d.R. auf einen aussagekräftigen Teil der Daten. Die entsprechende Auswahl (Bewertungsentscheidung) treffen die Wissenschaftler*innen bzw. die Forschungsgruppenleiter*innen zusammen mit der Institutsleitung und dem Archiv der MPG. Bei der Frage, welche Forschungsdaten für eine Langzeitarchivierung inhaltlich in Frage kommen könnten, ist eine Orientierung entlang folgender Leitfragen möglich (nicht abschließend!):

  • Könnten die Daten zukünftig reproduziert werden oder wäre dies, wenn überhaupt, nur mit einem großen Ressourcenaufwand möglich?

  • Ist meine Forschungsfrage oder Herangehensweise richtungsweisend für die Forschung?

  • Benötige ich die Forschungsdaten zukünftig für die weitere Forschung?

  • Welche anderen Forschungsfragen wären im Hinblick auf die eigene aber auch anderen Fachdisziplinen anhand der erhobenen Daten außerdem vorstellbar?

  • Inwieweit würde der Verlust der Daten spätere Forschungen in diesem oder anderen Forschungsfeldern erschweren / verhindern?

  • Sind die Daten gemäß der FAIR-Prinzipien so aufbereitet und dokumentiert, dass sie von potentiell Nachnutzenden aufgefunden und nachgenutzt werden können?

  • Liegen die Daten in langzeitarchivfähigen Formaten vor oder ist eine Migration in langzeitarchivfähige Formate möglich (s. dazu Punkt b) Nutzung langzeitarchivfähiger Daten-Formate)?

  • Unter welchen rechtlichen Voraussetzungen dürfen die Daten nach Projektende durch andere Forschende genutzt werden?


Voraussetzungen

Um Forschungsdaten langfristig für eine spätere Nachnutzung zu erhalten, muss im Rahmen einer Langzeitarchivierung der Erhalt der Authentizität, Integrität sowie die inhaltliche Verständlichkeit und Zugänglichkeit der Daten gewährleisten sein. Generell gilt: Aufgrund ihrer mitunter hohen Komplexität ist eine Langzeitarchivierung von Forschungsdaten rechtzeitig, d.h. idealerweise im Rahmen des Forschungsdatenmanagements im Vorfeld der eigentlichen Datenerhebung bzw. spätestens bis Projektende, zu planen. Nachfolgende Aspekte gilt es hierbei zu beachten:

a) Klärung der Eigentums- und Nachnutzungsrechte

Für eine Langzeitarchivierung ist zunächst die rechtliche Klärung des Zugangs zu den Daten zwingend erforderlich da der organisatorische und finanzielle Aufwand für eine Langzeitarchivierung nur für Daten zu rechtfertigen ist, die rechtlich auch tatsächlich nachgenutzt werden dürfen. Insbesondere folgende Fragen sollten beantwortet werden:

  • Wem gehören die Daten?

  • Unter welchen Voraussetzungen dürfen die Daten nach Projektende durch andere Forschende genutzt werden?

b) Nutzung langzeitarchivfähiger Daten-Formate

Allein bestimmte digitale Dateiformate sind für einen Langzeiterhalt geeignet. Aus diesem Grund sollte bereits im Vorfeld überlegt werden, ob langzeitarchivfähige Formate gewählt werden können. Informationen zu bereits definierten langzeitarchivfähigen Formaten finden sich auf den Internetseiten der „Schweizer Koordinationsstelle für die dauerhafte Archivierung elektronischer Unterlagen“.

c) Beschreibung und Dokumentation der Daten

Um Forschungsdaten dauerhaft nachnutzbar zu halten, ist neben des Erhalts der Daten an sich (= Bitstream) die Erhebung und der Erhalt verschiedener Meta-Daten zu deren Verständnis notwendig. Es gilt auch hier: Je genauer langzeitarchivierte Daten beschrieben sind, umso wahrscheinlicher kann eine Nachnutzung erfolgen. Zur Beschreibung von Forschungsdaten benötigt das Archiv mindestens folgende Metadaten:
(►Download Metadatenkatalog)

 


Abb. Header:
Links: Entnahme von Wasserproben mit einer CTD-Rosette unter Aufsicht von Thorsten Dittmar vom MPI für marine Mikrobiologie in Bremen 
© MPI für marine Mikrobiologie  ;
Rechts: Meteorologische Messungen auf einer Wetterstation bei Jena mit Ökosystemdaten durch Markus Reichstein vom MPI für Biogeochemie
© David Ausserhofer

Zur Redakteursansicht