Skip to main contentSkip to page footer

Dateiformate

Wenn Dateien über Jahre hinweg erhalten werden und technisch lesbar sein sollen, ist es notwendig, die Software zum Lesen dieser Dateien vorzuhalten und die Dateien regelmäßig in neuere Formate zu migrieren. Um FAIRe Daten zu erhalten, wird daher empfohlen, nicht-proprietäre und/oder gängige Dateiformate zu verwenden, die mit offener Software bearbeitet werden können.

Nachfolgend finden Sie eine Übersicht über die von den Forschungsdatenzentren im VerbundFDB empfohlenen und akzeptierten Dateiformate für Daten der quantitativen und qualitativen Forschung:

TabellenTexteBilderAudioVideoWeiterführende Informationen und Quellen

Planen Sie selbst erhobene Forschungsdaten zu übergeben? Im Rahmen der Kuratierung und Langzeitarchivierung überführen Forschungsdatenzentren Dateien gegebenenfalls in andere Formate. Daher sollten die Dateien nicht verschlüsselt seien. 

Tabellen

Grundsätzlich sollten Datensätze so übergeben werden, dass sie mit einem der weit verbreiteten Statistikpakete SPSS, Stata, R oder SAS genutzt werden können. Dafür gibt es verschiedene Möglichkeiten:

  1. Daten können in den proprietären Formaten der gängigen Statistikprogramme als sogenannte Systemfiles, etwa SPSS System File, übergeben werden.
  2. Daten können in software-spezifischen portablen Dateiformaten, etwa SAS Transport File, übergeben werden.
  3. Daten können in textbasierten Komma-, Tabulator- oder Spalten getrennten Formaten zusammen mit entsprechenden Setup- oder Syntax-Dateien zum Einlesen in die jeweiligen Statistikprogramme übergeben werden.

Akzeptierte Formate:

  • SPSS *.sav, *.por
  • STATA *.dta
  • R *.rds, *.rda
  • SAS Transport *.sas
  • Tabulator-, Komma- oder Spalten getrennte Textdatei *.csv mit zusätzlicher Setup-Datei (Setup-, Command- oder Syntax-File für SPSS, Stata, SAS etc.) mit entsprechenden Datendefinitionen (Variablennamen und -label, fehlenden Werten etc.).
  • OpenDocument-Tabellendokument *.ods, MS Excel *.xls und *.xlsx, MS Access *.mdb und *.accdb
  • CSV-Formate ohne zusätzliche Datendefinitionsdateien (Setup-, Syntax-, Command-File)
  • Column-Binary-Format (Column Binary ist ein Standard, um Daten als Abbilder von Lochkarten zu repräsentieren) oder Card-Image-Format

Texte

Akzeptierte Formate:

  • MS Word *.doc und *.docx
  • PDF *.pdf
  • OpenDocument-Text *.odt
  • Rich-Text-Format *.rtf
  • HTML *.htm und *.html
  • Plain-Text-Formate ASCII, ANSI

Bilder

Akzeptierte Formate:

  • TIFF Version 6 unkomprimiert *.tif
  • JPEG *.jpg und *jpeg, PNG *.png, GIF *.gif, BMP *.bmp

Audio

Akzeptierte Formate:

  • MPEG-1 Audio Layer 3 *.mp3
  • Wave Audio Format WAV *.wav

Video

Akzeptierte Formate:

  • MPEG-4 *.mp4, MPEG-2 *.mpg
  • Audio Video Interleave AVI *.avi
  • Windows Media Video WMV *.wmv

Weiterführende Informationen und Quellen