Skip to main contentSkip to page footer

Daten langfristig sichern

Forschungsdaten, die nicht an ein Forschungsdatenzentrum übergeben werden, sollten langfristig aufbewahrt werden, so dass die darauf basierenden Forschungsergebnisse nachvollziehbar und überprüfbar sind.

Im Folgenden werden zentrale Schritte der Langfristsicherung beschrieben.

Warum Daten langfristig sichern? – GlaubwürdigkeitHow-to Daten langfristig sichern in 3 SchrittenWeiterführende Informationen und Quellen

Warum Daten langfristig sichern? – Glaubwürdigkeit

Forschungsergebnisse müssen nachprüfbar und nachvollziehbar sein. Daher ist es erforderlich, die den Ergebnissen zugrundeliegenden Daten aufzubewahren. Dritten wird so ermöglicht, die publizierten Forschungsergebnisse anhand der Daten zu reproduzieren. Langfristig gesichert werden sollte daher alles, was zur Reproduktion der veröffentlichten Forschungsbefunde erforderlich ist. Dazu gehört auch eine ausreichende Dokumentation.

Es gehört zur Guten Wissenschaftlichen Praxis, Forschungsdaten für mindestens zehn Jahre nachvollziehbar aufzubewahren.

Im Stamp, dem „Standardisierten Datenmanagementplan für die Bildungsforschung“ ist folgender Standard definiert:

„Daten und Begleitmaterialien, die Dritten nicht zur Nachnutzung verfügbar gemacht werden können, werden im Sinne guter wissenschaftlicher Praxis für eine Sicherungsdauer von mindestens 10 Jahren über das Projektende hinaus aufbewahrt."

How-to Daten langfristig sichern in 3 Schritten

1. Speicherort auswählen2. Datenpaket zusammenstellen3. Daten löschen

Speicherort auswählen

Informieren Sie sich über die Services Ihrer Einrichtung.

In der Regel sollte Ihre eigene Einrichtung ein Angebot zur Langfristsicherung von in Forschungsprojekten generierten Daten anbieten. Informieren Sie sich, ob es sich hierbei um Bitstream Preservation handelt, das heißt die rein physische Speicherung der Daten im Zustand ihrer Ablieferung oder ob Maßnahmen zum Erhalt der Daten über die Zeit angewendet werden. Dazu gehören die Migration von Daten - die Speicherung von Daten in neueren Formaten - und die Emulation von Daten - die Imitation einer alten Software-Umgebung auf einer neueren Systemumgebung.

 

Klären Sie, welche rechtlichen Einschränkungen hinsichtlich der langfristigen Aufbewahrung der Forschungsdaten bestehen.

Stellen Sie sicher, dass die rechtlichen Vorgaben eingehalten werden. Dazu gehört zum Beispiel, dass ein ausreichender Zugriffsschutz besteht.

 

Klären Sie, wie der Zugang zu den Dateien in der Langfristsicherung geregelt ist.

Dies ist zum Beispiel für den Fall relevant, dass Ihre Forschungsbefunde angezweifelt werden und die Daten zur Replikation benötigt werden.

 

Achten Sie auf die Haltbarkeit und Lebensdauer der elektronischen Medien.

Datenträger und elektronische Medien veralten. Nutzen Sie zum Beispiel Serverfestplatten mit längerer Lebensdauer. Üblicherweise sind regelmäßige Medienmigrationen erforderlich. Eingelagerte Datenträger wie Festplatten, USB-Sticks, Bänder oder DVD-Rs entmagnetisieren sich über die Zeit oder altern anderweitig. Betriebssysteme und Dateisysteme ändern sich.

 

Nutzen Sie gängige Formate und wenn möglich offene Formate.

Software und Dateiformate veralten und können so unzugänglich werden. Offene Formate sind Formate, die auf allen Betriebssystemen verwendbar sind. Ob proprietär oder nicht, berücksichtigen Sie soweit möglich Langzeitverfügbarkeit und Support jeglicher Hard- und Software, die Sie zur Speicherung von Daten und Dokumentation verwendet haben.

Datenpaket zusammenstellen

Stellen Sie das Datenpaket zur Langfristsicherung zusammen.

Das Datenpaket sollte alles enthalten, das benötigt wird, um die veröffentlichten Forschungsergebnisse reproduzieren können. Stellen Sie sich vor, Ihre Forschungsergebnisse werden angezweifelt. Sie sollten dann in der Lage sein, dies zu widerlegen. Hierzu müssen Sie die Datengrundlagen herausgeben und es muss Dritten möglich sein, die Befunde zu reproduzieren. 

 

Welche Daten sollte ich aufbewahren?

Aus Gründen der Nachvollziehbarkeit ist es sinnvoll auch die Rohdaten aufzubewahren. Auch in der Leitlinie 17 der GWP zur Archivierung von Forschungsdaten wird von „in der Regel Rohdaten“ gesprochen.

Bei qualitativen Interviews wären das die Transkripte und die Audiodateien, bei Surveydaten der bereinigte, aufbereitete Datensatz und die Papier-Fragebögen. Diese Rohdaten aufzubewahren ist jedoch nicht immer sinnvoll oder möglich. Es kann notwendig sein, die Audiodateien aus Gründen des Datenschutzes zu vernichten, und die Papierfragebögen zu schreddern – etwa aus Platzgründen. Es gibt daher keine allgemeingültige Aussage welche Rohdaten langfristig gesichert werden sollten, sondern ist im Einzelfall zu entscheiden.

 

Achten Sie dabei auf mögliche rechtliche Einschränkungen.

Kennzeichnen Sie urheberrechtlich geschützte Materialien Dritter oder entfernen Sie diese. Achten Sie auf die eindeutige und anonymisierte Benennung der Dateien. Sich verändernde Datenschutzmaßnahmen müssen nachträglich umgesetzt und aktualisiert werden.

Heben Sie ein Muster der Einwilligungserklärung auf oder – je nach Bedarf – die Einwilligungserklärungen im Original.

 
Achten Sie auf eine ausreichende Dokumentation der Daten.

Neben der physischen Sicherung der Forschungsdaten ist für deren langfristige Interpretierbarkeit auch eine entsprechende Dokumentation erforderlich. Für jede Art von Daten sind stets auch Informationen zu erfassen und aufzubewahren, die zur Verwendung der eigentlichen Daten notwendig sind, zu erfassen und aufzubewahren.Zu Hinweisen zur Dokumentation

Daten löschen

Stellen Sie sicher, dass Daten, nach Ablauf der Sicherungsdauer, vollständig gelöscht werden.

Stellen Sie ebenfalls sicher, dass Daten, die nicht langfristig gesichert werden können, gelöscht werden.Zu Hinweisen zum Löschen von Dateien

Weiterführende Informationen und Quellen