DE | EN
Logo Forschungsdaten Bildung
Logo DIPF
Daten managen Organisieren Dateiformate

Dateiformate

Wenn Dateien über Jahre hinweg erhalten werden und technisch lesbar sein sollen, ist es notwendig, die Software zum Lesen dieser Dateien vorzuhalten und die Dateien regelmäßig in neuere Formate zu migrieren. Um FAIRe Daten zu erhalten, wird daher empfohlen, nicht-proprietäre und/oder gängige Dateiformate zu verwenden, die mit offener Software bearbeitet werden können.

Nachfolgend finden Sie eine Übersicht über die von den Forschungsdatenzentren im VerbundFDB empfohlenen und akzeptierten Dateiformate für Daten der quantitativen und qualitativen Forschung:

 Tabellen

 Texte

 Bilder

 Audio

 Video

 Weiterführende Informationen und Quellen

 Planen Sie selbst erhobene Forschungsdaten zu übergeben?

Im Rahmen der Kuratierung und Langzeitarchivierung überführen Forschungsdatenzentren Dateien gegebenenfalls in andere Formate. Daher sollten die Dateien nicht verschlüsselt sein. Auch teilweises Sperren von Funktionen wie Drucken oder Kopieren in geschützten PDF-Dateien gilt es zu vermeiden.

Tabellen

Grundsätzlich sollten Datensätze so übergeben werden, dass sie mit einem der weit verbreiteten Statistikpakete SPSS, Stata, R oder SAS genutzt werden können. Dafür gibt es verschiedene Möglichkeiten:

  1. Daten können in den proprietären Formaten der gängigen Statistikprogramme als sogenannte Systemfiles, etwa SPSS System File, übergeben werden.
  2. Daten können in software-spezifischen portablen Dateiformaten, etwa SAS Transport File, übergeben werden.
  3. Daten können in textbasierten Komma-, Tabulator- oder Spalten getrennten Formaten zusammen mit entsprechenden Setup- oder Syntax-Dateien zum Einlesen in die jeweiligen Statistikprogramme übergeben werden.

Akzeptierte Formate:

  • SPSS *.sav, *.por
  • STATA *.dta
  • R *.rds, *.rda
  • SAS Transport *.sas
  • Tabulator-, Komma- oder Spalten getrennte Textdatei *.csv mit zusätzlicher Setup-Datei (Setup-, Command- oder Syntax-File für SPSS, Stata, SAS etc.) mit entsprechenden Datendefinitionen (Variablennamen und -label, fehlenden Werten etc.).
  • OpenDocument-Tabellendokument *.ods, MS Excel *.xls und *.xlsx, MS Access *.mdb und *.accdb
  • CSV-Formate ohne zusätzliche Datendefinitionsdateien (Setup-, Syntax-, Command-File)
  • Column-Binary-Format (Column Binary ist ein Standard, um Daten als Abbilder von Lochkarten zu repräsentieren) oder Card-Image-Format

Texte

Akzeptierte Formate:

  • MS Word *.doc und *.docx
  • PDF *.pdf
  • OpenDocument-Text *.odt
  • Rich-Text-Format *.rtf
  • HTML *.htm und *.html
  • Plain-Text-Formate ASCII, ANSI

Bilder

Akzeptierte Formate:

  • MS Word *.doc und *.docx
  • PDF *.pdf
  • OpenDocument-Text *.odt
  • Rich-Text-Format *.rtf
  • HTML *.htm und *.html
  • Plain-Text-Formate ASCII, ANSI

Audio

Akzeptierte Formate:

  • MPEG-1 Audio Layer 3 *.mp3
  • Wave Audio Format WAV *.wav

Video

Akzeptierte Formate:

  • MPEG-4 *.mp4, MPEG-2 *.mpg
  • Audio Video Interleave AVI *.avi
  • Windows Media Video WMV *.wmv

Weiterführende Informationen und Quellen

 Themenseite Formate auf forschungsdaten.info
Ein Überblick zum Thema Dateiformate für die Langfristsicherung auf dem Informationsportal forschungsdaten.info.

 Katalog archivischer Dateiformate
Eine Übersicht über archivische Dateiformate der Koordinationsstelle für dauerhafte Archivierung elektronischer Unterlagen (KOST).

 Bewertungsmatrix | 2021
Eine Matrix zur Bewertung der Archivtauglichkeit verschiedener Dateiformate der Koordinationsstelle für dauerhafte Archivierung elektronischer Unterlagen (KOST).

 Stamp – Datenorganisation im Forschungsdatenmanagement

Der Stamp definiert FAIR Data Standards für das gesamte Forschungsdatenmanagement. Hier finden Sie den Standard zur Datenorganisation.

Standard Datenschutz: Daten und Begleitmaterialen werden im Projektverlauf und soweit nötig darüber hinaus systematisch gespeichert, in einem zugriffsgeschützten Back-Up-System gesichert und ihre Nutzbarkeit gewährleistet.

Erläuterung: Ziel einer systematischen Datenorganisation ist der Schutz der Daten und Begleitmaterialien vor versehentlichem Verlust, Verändern, Überschreiben etc. sowie die Sicherstellung der Zugänglichkeit der Materialien für alle Projektbeteiligten. Dies geht einher mit einer adäquaten Strategie zur Speicherung der Daten und Begleitmaterialien, entsprechend den Bedarfen und Möglichkeiten des Projekts.

Letzte Aktualisierung: 17.06.2024

Verbund Forschungsdaten Bildung (VerbundFDB)

c/o DIPF | Leibniz-Institut für Bildungsforschung und Bildungsinformation
Rostocker Str. 6
60323 Frankfurt am Main

Tel.: +49 (0)69 247 08 - 300
verbund@forschungsdaten-bildung.de