DE | EN
Logo Forschungsdaten Bildung
Logo DIPF
Daten managen Organisieren Dateien benennen

Dateien benennen und organisieren

Im Folgenden finden Sie Hinweise zum Organisieren und Benennen von digitalen Forschungsdaten, das heißt, es geht um Dateinamen, Versionierung und Ordnerstrukturen.

Für die eigene Arbeit und das eigene Forschungsprojekt ist es hilfreich, hierfür spezifische Regelungen festzulegen.

Ordner und Dateien sollten systematisch benannt und geordnet sein, damit

  • die Dateien jetzt und in Zukunft, durch die Erstellenden der Datei oder andere Projektmitarbeitende leicht auffindbar und zugänglich sind,
  • längeres Suchen von Dateien oder das Vergleichen verschiedener Versionen von Dateien vermieden wird,
  • Änderungen nachvollziehbar sind und
  • die Dateien nicht versehentlich gelöscht oder überschrieben werden.

Hier gelangen Sie zu den einzelnen Kapiteln:

 Dateiorganisation/Ordnerstruktur

 Versionierung von Dokumenten

 Benennung von Dateien

 Benennung von Forschungsdaten und Forschungsmaterialien

 Weiterführende Hinweise und Quellen

Hinweise

Tools zur (Um-) Benennung von Dateinamen
(Auswahl)

Dateiorganisation/Ordnerstruktur

Die Art der Dateiorganisation ist u. a. abhängig von den Rahmenbedingungen eines spezifischen Projektes. Diese geben eventuell einen bestimmten Ablageort oder eine bestimmte Sortierung vor. Eine Rolle spielen dabei beispielsweise die datenschutzrechtliche und ethische Sensibilität der Daten, etwaige Urheberrechte und Lizenzen, die Art und Anzahl unterschiedlicher Datentypen, die in einem Projekt verwendet werden, sowie das erwartete Dateivolumen.  

Ablageort

Ein geeigneter Ablageort für Dateien

  • verfügt über ausreichend Speicherkapazität,
  • ist Teil eines Backup-Managements,
  • ermöglicht allen beteiligten und berechtigten Personen Zugriff und
  • verhindert Zugriff durch Unbefugte.

Ordnerstruktur

Eine Ordnerstruktur ist idealerweise hierarchisch gegliedert und sollte inhaltlich aufeinander aufbauen.

Folgende Ordnungskategorien kommen in Betracht:

  • Teilprojekte, Arbeitspakete oder Funktionseinheiten innerhalb eines Projektes
  • Personen
  • Datum oder Zeitraum (z. B. Monate, Quartale)
  • Inhalte der Ordner bzw. Ordnertypen (z. B.
    • Forschungsdaten (oder Datentypen),
    • Publikationen und Berichte,
    • Datenanalysen,
    • Konferenzen,
    • Literatur,
    • Projektkoordination)
  • Art der Dateien (Formate)

Beispiele für Ordner im Rahmen eines Ordnersystems (vgl. Long 2009):

  • „mailbox“: Ein Ordner für wichtige E-Mails, die aufbewahrt werden sollen. Das eigene E-Mail-Postfach kann schnell überfüllt sein und unübersichtlich werden, daher kann die Einrichtung eines solchen Ordners hilfreich sein.
  • „to clean“-Ordner: Ein Ordner für Dateien, die man noch „aufräumen“ - d.h. an den richtigen Ablageort verschieben - muss.
  • „hold then delete“-Ordner: Ein Ordner für Dateien, die nicht mehr gebraucht werden, die man aber noch nicht löschen möchte, weil: vielleicht braucht man sie ja doch noch einmal…
  • „posted“-Ordner: Ein Ordner für Dateien, die an Dritte herausgegangen sind. Manchmal werden Versionen von Dateien verschickt, die noch in Bearbeitung sind. Es kann für die spätere Nachvollziehbarkeit wichtig sein, genau diese Version der Datei, aufzubewahren.

Versionierung von Dokumenten

Um verschiedene Stadien der Bearbeitung von Dateien nachvollziehen und unterscheiden zu können, sollte eine konsequente Versionierung vorgenommen werden. Diese sollte für die Erstellenden und allen anderweitig Beteiligten Sinn ergeben.

Versionierungen können im Dateinamen, in der Datei selbst oder in einem gesonderten Versionierungsdokument vorgenommen werden.

 

Beispiel - Versionierung in der Datei oder in einem gesonderten Dokument:

Parameter
 
Version
2.0
Datum letzte Änderung
19.6.2017
Geändert durch
Max Mustermann
öffentlich / vertraulich
öffentlich

 

Versionsdoku
Änderungen
1.0. (1.3.2016)
Freigabe
1.1. (1.7.2016)
Verbesserung Rechtschreibfehler
1.2. (7.12.2016)
Änderung im Layout
2.0. (19.6.2017)
Neues Kapitel (3.1.) hinzugefügt

 

Beispiel - Versionierung im Dateinamen:

  • Die Versionierung kann bspw. anhand natürlicher Zahlen (v1, v2, v3) erfolgen und zwischen größeren und kleineren Änderungen unterscheiden:
    • Beispiel für größere Änderungen = Beispieldatei_v1 -> Beispieldatei_v2
    • Beispiel für kleinere Änderungen = Beispieldatei_v1.1 -> Beispieldatei_v1.2
  • Verwirrende Zusatzbezeichnungen sollten vermieden und der Dateiname sollte konstant beibehalten werden:
    • statt „Original1“, „Bearbeitung“, „Bearbeitung2“, „final“, „final2“, eher „Beispieldatei_v1“, „Beispieldatei_v1.1“, „Beispieldatei_v1.2“, „Beispieldatei_v2“, „Beispieldatei_v2.1“

Weitere Hinweise

  • jede Änderung sollte vermerkt werden
  • veraltete Versionen sollten getrennt gespeichert, verworfen oder gelöscht werden,
  • die originale Kopie sollte stets erhalten bleiben
  • eine Auto-Backup-Software kann das Speichern oder Archivieren mehrerer Versionen ersetzen
  • eine Kontrollsoftware kann die Versionierung überprüfen (z. B. Subversion, TortoiseSVN)
  • oder Sie nutzen Software mit automatischer Bearbeitungshistory

Hinweis

Zur Versionierung von Daten hat die Data Documentation Initiative (DDI Alliance) einen Standard formuliert:

 Versioning

Benennung von Dateien

Die Art und Weise der Benennung von Dateien ist ein wichtiger Baustein der Dateiaufbewahrung und -sicherung.

Eine klare Dateibenennung,

  • dient dazu Dateien innerhalb eines Ordner eindeutig unterscheiden zu können,
  • verhindert Probleme, insbesondere wenn mehrere Personen gemeinsam an Dateien arbeiten,
  • erleichtert die Zuordenbarkeit und Wiederauffindbarkeit, insbesondere wenn Dateien versehentlich verschoben wurden und
  • dient der Übersichtlichkeit, da Dateien logisch sortiert angezeigt werden.

Richtlinien für die gewählte Methode zur Benennung von Dateien:

  • Die Methode sollte die Beschränkungen der jeweils genutzten Software berücksichtigen (Bsp.: Bedeutung von Groß- und Kleinschreibung, Sonderzeichen oder Leerzeichen).
  • Dateinamen sollten Rückschlüsse über deren Inhalt erlauben, damit Dateien auch unabhängig von ihren Speicherorten zugeordnet und aufgefunden werden können. Dies ist insbesondere wichtig bei versehentlichem Verschieben von Dateien;
  • Die Benennung von Dateien sollte einheitlich und konsistent erfolgen;
  • Dateinamen sollten nicht zu lange sein.

Mögliche Probleme durch zu lange Dateinamen und –pfade:

  • Leer- und Sonderzeichen (& * % $ £ ] { ! @) - außer Unterstrich und Bindestrich - sowie Umlaute sind zu vermeiden.
  • Verwenden Sie eindeutige Namen, keine generischen Namen (z.B. „Daten“, „Text“), um Verwechslungen zu vermeiden.
  • Lange Namen und zu viele Ebenen sollten vermieden werden, damit nicht die zulässige Pfadlänge von Windows (255 Zeichen) überschritten wird.

Dateienbenennen_Pfadlaenge.jpg

Dateienbenennen_Sonderzeichen.jpg.png

Beispiel für eine Fehlermeldung, die erscheint, wenn die zulässige Pfadlänge überschritten wird. Beispiele für Fehler, die auftreten können, wenn in den Dateinamen zu viele Umlaute verwendet wurden.

Mögliche Bestandteile von Dateinamen:

  • Inhaltsstichwort oder Kurztitel (kurz, relevant sowie ausreichend, um Inhalt zuordnen zu können; ca. 25 Zeichen) [2010-08-11_bioassay_toxicity_V1.sps] 
  • Name oder eindeutiges Kürzel der entsprechenden Bearbeiter*innen/Ersteller*innen/Verantwortlichen
  • Name des Forschungsteams/Abteilung
  • Datum der Erstellung/ Änderung/ Publikation (Format Jahr-Monat-Tag: JJJJ-MM-TT oder JJJJ-MM oder JJJJ-JJJJ oder JJMMTT (2006-03-24_Dateibeschreibung).
  • Bearbeitungsstadium (z.B. Original, Entwurf, korrigiert, Ausschnitt, gefiltert, usw.)
  • Versionsnummer
  • Projektnummer
  • Nutzung von Anhängsel, die die Software, mit der die Datei erstellt wurde, kennzeichnet (.xls/.xlsx für Excel; .txt für Textdateien; für weitere, siehe    Empfohlene Dateiformate)

Benennung von Forschungsdaten und Forschungsmaterialien

Im Folgenden werden wichtige Bezeichnungen für die Benennungen der jeweiligen Dateien rot markiert.

Bestandteile von Dateinamen im Allgemeinen

  • ID oder Studiennummer: zur Zuordnung zur Studie
  • Kürzel für Daten- bzw. Materialtyp: Interview, Video, Fragebogen etc.
  • Laufende Nummer von Datentypen: 001 ff.
  • Serienummer: verschiedene Dateien je Datentyp (z.B. Ein Video besteht aus mehreren Dateien): a,b,c ff.
  • Versionsnummer: falls Änderungen durchgeführt werden und dokumentiert werden sollen, zum Beispiel durch Anonymisierung

[ID oder Studiennummer]_[Kürzel für Daten- bzw. Materialtyp]_[laufende Nummer]_[ggf. Version]_[ggf. Seriennummer]

Qualitative Interviews "int"

Mögliche Bestandteile des Namens:
[ID oder Studiennummer]_[Kürzel für Interview]_[laufende Nummer]_[Version]

Beispiel: Dateibenennung für das erste geführte Interview

  • RTF Transkript: s01_int01_v01 (rtf-Datei, gespeichert als s01_int_001_v01.rtf)
  • MP3 Audiodatei: s01_int01_v01 (mp3-Datei, gespeichert als s01_int_001_v01.mp3)
  • WAV Audiodatei: s01_int01_v01 (wav-Datei, gespeichert als s01_int_001_v01.wav)

Beispiel: Mehrere Audiodateien je Interview

[ID oder Studiennummer]_[Kürzel für Interview]_[laufende Nummer]_[Version]_[Kennzeichner für Serie]

  • Audiodatei 1, Interview 1. Teil: S01_int01_v01_a
  • Audiodatei 1, Interview 2. Teil: S01_int01_v01_b
  • Audiodatei 1, Interview 3. Teil: S01_int01_v01_c

Fokusgruppen "fg"

Beispiel: Dateibenennung für das erste Transkript der Fokusgruppe

[ID oder Studiennummer]_[Kürzel für Fokusgruppe]_[laufende Nummer]_[Version]

s01_fg01_v001 (rtf-Datei, gespeichert als s01_fg_001_v01.rtf)

Bild- und Videodateien "pic", "vid"

Beispiel: Erste Bild- und Videodatei

[ID oder Studiennummer]_[Kürzel für Bild oder Video]_[laufende Nummer]_[Version]

  • Erste Bilddatei aus Studie s01: s01_pic001_v01
  • Erste Videodatei aus Studie s01: s01_vid001_v01

Beispiel: Ein Bild steht im Zusammenhang mit einem speziellen Ereignis oder einer bestimmten Veranstaltung (z.B. Bild einer Fokusgruppe oder einer bestimmten Person)

[ID oder Studiennummer]_[Bild oder Video]_[laufende Nummer]_[Version]_[Kennzeichner für Serie]

  • fünftes Bild aus einer Reihe von 10 Bildern, zugehörig zu Interview Nr. 8, aus Studie s01: s01_pic008_v01e
    In diesem Fall steht das ‘e’ als fünfter Buchstabe des Alphabets für das fünfte Bild.

Beispiel: Das Bild gehört zu einem Interview, die Benennung erfolgt entsprechend der Benennung des zugehörigen Interviews mit Bilddateiendung (.tiff)

  • Dateibenennung für das erste geführte Interview in Studie s01, dazugehörige/s Transkript und Bilddatei:
    • RTF Transkript: S01_int001_v01.rtf
    • Audiodatei: S01_int001_v01.mp3
    • Bilddatei: S01_int001_v01.tiff

Beobachtungen "obs", Feldnotizen "notes"

Beispiel: Schriftliche Aufzeichnungen während einer Gedichtinterpretation im Unterricht

[ID oder Studiennummer]_[Art des Unterrichtsmaterials]_[laufende Nummer]

  • Gedicht: s01_gedicht01
  • Notizen/Transkript der Beobachtungen: s01_obs01
  • Feldnotizen: s01_notes01

Quantitative Daten "ds", "syn", "op"

[ID oder Studiennummer]_[Kennzeichner für Datensatz]_[Version]
z.B. s5600_ds01_v01

[ID oder Studiennummer]_[Kennzeichner für Syntax]_[Version]
z.B. s5600_syn01_v01

[ID oder Studiennummer]_[Kennzeichner für Output]_[Version]
z.B. s5600_op01

Materialien

[ID oder Studiennummer]_[Dateityp]_[Version]

Beispiele:

  • Methodenbericht: s01_mb_v01
  • Fragebogen: s01_fb_v01
  • Codeplan: s01_cp_v01

Weiterführende Hinweise und Quellen

Kaps, R. und Volker S. 2017.  Vertiefungsworkshop zum Forschungsdatenmanagement. Dateienorganisation und Projektablage (Workshop im Rahmen des Weiterbildungsprogramms der Leibniz Universität Hannover, 9. März 2017).

Long, J. S. (2009). The Workflow of Data Analysis Using Stata. Texas: Stata Press.

 Research Data Management Training der University of Edinburgh zu "Organising Data".

Letzte Aktualisierung: 20.07.2018

Verbund Forschungsdaten Bildung (VerbundFDB)

c/o DIPF | Leibniz-Institut für Bildungsforschung und Bildungsinformation
Rostocker Str. 6
60323 Frankfurt am Main

Tel.: +49 (0)69 247 08 - 300
verbund@forschungsdaten-bildung.de