Dateiformate
Wenn Dateien über Jahre hinweg erhalten werden und technisch lesbar sein sollen, ist es notwendig, die Software zum Lesen dieser Dateien vorzuhalten und die Dateien regelmäßig in neuere Formate zu migrieren. Um FAIRe Daten zu erhalten, wird daher empfohlen, nicht-proprietäre und/oder gängige Dateiformate zu verwenden, die mit offener Software bearbeitet werden können.
Nachfolgend finden Sie eine Übersicht über die von den Forschungsdatenzentren im VerbundFDB empfohlenen und akzeptierten Dateiformate für Daten der quantitativen und qualitativen Forschung:
TabellenTexteBilderAudioVideoWeiterführende Informationen und Quellen
Planen Sie selbst erhobene Forschungsdaten zu übergeben? Im Rahmen der Kuratierung und Langzeitarchivierung überführen Forschungsdatenzentren Dateien gegebenenfalls in andere Formate. Daher sollten die Dateien nicht verschlüsselt seien.
Tabellen
Grundsätzlich sollten Datensätze so übergeben werden, dass sie mit einem der weit verbreiteten Statistikpakete SPSS, Stata, R oder SAS genutzt werden können. Dafür gibt es verschiedene Möglichkeiten:
- Daten können in den proprietären Formaten der gängigen Statistikprogramme als sogenannte Systemfiles, etwa SPSS System File, übergeben werden.
- Daten können in software-spezifischen portablen Dateiformaten, etwa SAS Transport File, übergeben werden.
- Daten können in textbasierten Komma-, Tabulator- oder Spalten getrennten Formaten zusammen mit entsprechenden Setup- oder Syntax-Dateien zum Einlesen in die jeweiligen Statistikprogramme übergeben werden.
Akzeptierte Formate:
- SPSS *.sav, *.por
- STATA *.dta
- R *.rds, *.rda
- SAS Transport *.sas
- Tabulator-, Komma- oder Spalten getrennte Textdatei *.csv mit zusätzlicher Setup-Datei (Setup-, Command- oder Syntax-File für SPSS, Stata, SAS etc.) mit entsprechenden Datendefinitionen (Variablennamen und -label, fehlenden Werten etc.).
- OpenDocument-Tabellendokument *.ods, MS Excel *.xls und *.xlsx, MS Access *.mdb und *.accdb
- CSV-Formate ohne zusätzliche Datendefinitionsdateien (Setup-, Syntax-, Command-File)
- Column-Binary-Format (Column Binary ist ein Standard, um Daten als Abbilder von Lochkarten zu repräsentieren) oder Card-Image-Format
Texte
Akzeptierte Formate:
- MS Word *.doc und *.docx
- PDF *.pdf
- OpenDocument-Text *.odt
- Rich-Text-Format *.rtf
- HTML *.htm und *.html
- Plain-Text-Formate ASCII, ANSI
Bilder
Akzeptierte Formate:
- TIFF Version 6 unkomprimiert *.tif
- JPEG *.jpg und *jpeg, PNG *.png, GIF *.gif, BMP *.bmp
Audio
Akzeptierte Formate:
- MPEG-1 Audio Layer 3 *.mp3
- Wave Audio Format WAV *.wav
Video
Akzeptierte Formate:
- MPEG-4 *.mp4, MPEG-2 *.mpg
- Audio Video Interleave AVI *.avi
- Windows Media Video WMV *.wmv
Weiterführende Informationen und Quellen
Themenseite Formate auf forschungsdaten.info
Ein Überblick zum Thema Dateiformate für die Langfristsicherung auf dem Informationsportal forschungsdaten.info.
Katalog archivischer Dateiformate
Eine Übersicht über archivische Dateiformate der Koordinationsstelle für dauerhafte Archivierung elektronischer Unterlagen (KOST).
Eine Matrix zur Bewertung der Archivtauglichkeit verschiedener Dateiformate der Koordinationsstelle für dauerhafte Archivierung elektronischer Unterlagen (KOST).