Wie zitiere ich Forschungsdaten korrekt?
Eine korrekte Datenzitation ist nicht nur Ausdruck korrekten wissenschaftlichen Arbeitens. Durch die Datenzitation wird auch die Produktion von Forschungs- bzw. Statistik-Daten als eine primäre Wissenschaftsleistung anerkannt. Nicht nur Forschungspublikationen, sondern auch die im Forschungsprozess entstandenen Daten sollten im Sinne von »Good Scientific Practice« zitierbar sein und zitiert werden (vgl. Allianz der deutschen Wissenschaftsorganisationen, 2010).
Wie bei Textpublikationen ist die korrekte Zitation vor allem für den Datenproduzenten wichtig: Daten, die die Grundlage für wissenschaftliche Auswertungen und darauf basierende Publikationen bilden, schaffen einen Mehrwert für die Forschung. Daher sollte auch den Produzenten von Daten durch Zitationen eine entsprechende Anerkennung zuteil werden, dies umso mehr, da die Produktion und Dokumentation von Daten oftmals zu Lasten anderer wissenschaftlicher Leistungen (insbesondere Textpublikationen) gehen.
Die Entwicklung bibliometrischer Verfahren, die die Leistung der Daten-Produktion ähnlich den Impact-Faktoren bei Textpublikationen messbar machen, trägt zu einer erhöhten Relevanz von Datenzitationen bei. Die Grafik des Australian National Data Service (Abbildung 2) verdeutlicht diesen Prozess.
Abbildung 2:
Wie der Prozess der Datenzitation funktioniert
Wenn Sie entsprechende Daten gefunden und diese in Ihrer wissenschaftlichen Arbeit verwendet haben, stellt sich als Nächstes die Frage, wie Sie diese Quelle wissenschaftlich korrekt zitieren können.
Mittlerweile haben sich verschiedene Gruppen und wissenschaftliche Communities damit beschäftigt, Guidelines und Empfehlungen zur Zitation von Forschungsdaten zu erstellen.[ii] Obwohl sich die Herangehensweisen prinzipiell ähneln, existiert (noch) kein einheitlicher Standard.
Eine Datenzitation benötigt mindestens die bei gedruckten Werken bekannten bibliografischen Angaben wie Autor, Titel, Verlag, Publikationsdatum. Zusätzlich ist in vielen Empfehlungen die persistente Identifikation (also die dauerhafte Speicherung eines Datensatzes unter einer sich nicht verändernden Webadresse) wesentlicher Bestandteil einer guten Datenzitation. Diese Empfehlung liegt in der Tatsache begründet, dass Informationen in der digitalen Welt dynamischer und fragiler sind als in gedruckten Veröffentlichungen. Digitale Daten sind leichter veränderbar und die dadurch entstandenen neuen Versionen sind nicht immer eindeutig identifizierbar. Zusätzlich kann sich der ursprüngliche Speicherort ändern, was die Auffindbarkeit der Daten ohne eine persistente Identifikation des Objektes fast unmöglich macht (vgl. CODATA-ICSTI, 2013).
Persistente Identifikatoren, die in etwa einer einmalig vergebenen ISBN- bzw. ISSN-Nummer bei gedruckten Werken entsprechen, sind ein Weg zur Lösung der geschilderten Problematik.
Für die Identifikation von elektronischen Textpublikationen existieren mittlerweile diverse Systeme von Persistent Identifiern, die technisch auch die Basis zur Identifizierung von Daten leisten können: Archival Research Key (ARK), Digital Object Identifier (DOI), Handle, Persistent URL (PURL), Uniform Resource Name (URN) und weitere. Auf einen gemeinsamen Standard haben sich die verschiedenen Nutzergemeinden jedoch noch nicht geeinigt, obwohl die Systeme im Prinzip gut ineinander überführbar wären.
In der Übersicht 4 wird die Systematik der Datenzitation am Beispiel des am häufigsten verwendeten persistenten Identifikators, des DOI, beispielhaft vorgestellt. Wir empfehlen das DOI-System, das auch bei der Zitierung von Forschungspublikationen eine wesentliche Rolle spielt.
[ii] Beispiele finden sich beim ANDS, CODATA-ICSTI, da|ra, DataCite, Data-PASS, FORCE11, GESIS, IASSIST-SIGDC, ICPSR, IQSS, STD, Thomson Reuters Data Citation Index usw.
oder
…mehr Informationen zum DOI-System erhalten…
Alle auf dieser Webseite verwendeten Icons stammen von Freepik.com und sind unter einer CC-BY 3.0 Lizenz lizensiert.