Technische Infrastrukturen für Forschungsdaten
Im „Handlungsfeld II: Föderierte Informationsinfrastrukturen und Landesdienste“ des Landeskonzepts Forschungsdatenmanagement ist festgehalten, dass ein verteilter Betrieb von Infrastrukturen und ein kooperatives Angebot von Diensten auf- und ausgebaut werden soll.
Die technischen FDM-Landesdienste befinden sich zum Teil gegenwärtig im Aufbau oder der Konzeption. Damit stehen noch nicht alle Dienste und Funktionen in vollem Umfang zur Verfügung. Über ihren eigenen, aktuellen Entwicklungsstand informieren die jeweiligen Landesdienste. Um sich über den aktuellen Stand der Entwicklung zu informieren, wenden Sie sich an die in den FAQs angegeben Kontaktadressen. Als Hochschulangehörige wenden Sie sich an ihre lokale FDM-Servicestelle oder Ansprechperson.
Mit den Landesdiensten durch den Forschungsdatenlebenszyklus

Abbildung: FDM-Landesdienste entlang des Forschungsdatenlebenszyklus
Forschen mit den FDM-Landesdiensten: eine Vision
Im 2024 veröffentlichten Landeskonzept Forschungsdatenmanagement ist beschrieben, welche FDM-Landesdienste gegenwärtig bereits angeboten, aufgebaut oder konzipiert werden, um Forschenden der Mitgliedshochschulen der DH.NRW den Umgang mit Forschungsdaten zu erleichtern. Anhand der folgenden fiktiven Geschichte möchten wir die Einsatzszenarien der FDM-Landesdienste innerhalb eines Forschungszyklus darstellen. Daran anschließend sind weiterführende Informationen zu den einzelnen Landesdiensten zu finden.
Die FDM-Landesdienste befinden sich zum Teil gegenwärtig im Aufbau oder der Konzeption. Die beschriebenen Funktionen stehen damit noch nicht in vollem Umfang zur Verfügung. Über ihren eigenen, aktuellen Entwicklungsstand informieren die jeweiligen Landesdienste. Um sich über den aktuellen Stand der Entwicklung zu informieren, wenden Sie sich an die in den FAQs angegeben Kontaktadressen. Als Hochschulangehörige wenden Sie sich an ihre lokale FDM-Servicestelle oder Ansprechperson.
Hier Nachlesen
Frauke D. Meyer ist Informatikerin an einer Mitgliedshochschule der DH.NRW und erhebt in Kooperation mit einer Arbeitsgruppe aus den Sozialwissenschaften für ihre Simulationen große Datenmengen. Seit sie Zugriff auf die FDM-Landesdienste in NRW hat, kann sie damit ihre Forschungsdaten noch effizienter und transparenter verwalten.
Die Hochschulcloud Sciebo nutzt Frauke D. Meyer, um Dokumente zu organisieren. Dazu zählen beispielsweise Konzepte zum Onboarding neuer Mitarbeitenden oder Präsentationen über die Arbeit ihrer Arbeitsgruppe. Sciebo verfügt über ein integriertes Online-Office, das gängige Bearbeitungen von Textdokumenten, Präsentation und tabellarischen Daten unterstützt, und ermöglicht außerdem die Bearbeitung mit lokalen Office-Programmen. So wird das gemeinsame Bearbeiten und Teilen von Daten mit Kooperationspartner:innen und Kolleg:innen unterstützt. Für ein neues Projekt beantragt Meyer eine sogenannten Projektbox mit bis zu 2 TB zusätzlichem Speicher. Diese vereinfacht das gemeinsame Teilen und Bearbeiten von Dateien unterschiedlicher Formate. Meyer hat die Projektbox zwar beantragt, kann ihre Verwaltung jedoch nach Bedarf unkompliziert auf andere Personen übertragen. Daten in der Projektbox können zudem einfach mit Projektbeteiligten geteilt werden. Durch die Nutzung des Sciebo-Klienten kann Meyer jederzeit sowohl von ihrem Laptop als auch ihrem Smartphone auf die Daten zugreifen. Der Zugriff per Webbrowser auf dem Computer im Institut ihrer Kooperationspartner:innen ist ebenfalls möglich, so dass sie jederzeit die neueste Version der Daten zur Hand hat.
Aus den Ideen von Frauke D. Meyer und ihrer Kolleg:innen ist ein gefördertes Forschungsprojekt geworden. Für das Projekt sollen die Daten mit einem eigenen Software-Code analysiert werden. Dafür kann sich Meyer bei git.nrw anmeldem und erhält somit Zugriff zur NRW-weiten GitLab Instanz. Dort kann sie für ihre Forschungsdaten ein neues Projekt anlegen, sowie auch ihre internationalen Projektpartner:innen aus den USA und Japan als Gäste hinzufügen. Meyer kann mit git.nrw ihre Forschungsdaten und den dazugehörigen Software-Code versionieren. Das bedeutet, dass sie immer wieder auf Zwischenstände oder ältere Versionen zurückgreifen kann, wenn eine Änderung nicht das erwünschte Ergebnis hervorbringt oder kleine Fehler passieren. GitLab verfügt über ein integriertes Continuos Integration / Continuos Delivery Feature. Durch die Funktion CI/CD ist es möglich, Prozesse zu automatisieren. So kann die Forschergruppe mögliche Updates am Code automatisch integrieren, ältere Versionen des Codes einsehen und im Zweifel sogar auf einen vorherigen Stand zurücksetzen. Für ihr persönliches Datenmanagement kann Meyer außerdem die Projektmanagement-Tools in GitLab nutzen. Hierzu zählt ein Wiki, das sie bspw. mit Textbausteinen, Definitionen oder vorgeschriebenen Codes füllen kann. So hat sie alles an einem Ort, was sie für die Auswertung ihrer Daten und die Entwicklung neuer Codes benötigt. Zusätzlich bietet GitLab ein Ticket-Tool an, mit welchem sie sich einen Überblick über die Aufgaben verschaffen kann. Die Tickets lassen sich mit Tags versehen und auf einem Kanban-Board oder einem Meilensteinplan darstellen. So hat Meyer stets einen Überblick über die nächsten zu erledigenden Aufgaben und kann ihre Überlegungen zu bereits abgeschlossenen Aufgaben im zugehörigen Ticket nachlesen.
Ihre Simulationen führt Frauke D. Meyer mit JupyterHub.NRW in einem Jupyter-Notebook aus. In der Notebook-Oberfläche werden Programmcodes und Visualisierungen von Daten und Ergebnissen nebeneinander dargestellt, so dass Meyer ihre Simulationen interaktiv weiterentwickeln kann, ohne zwischen verschiedenen Programmen wechseln zu müssen. Sie arbeitet bequem im Webbrowser und führt ihre Programme auf leistungsstarken Rechnern in der Cloud aus, egal ob sie gerade im Büro, im Home Office oder unterwegs auf Dienstreise ist. Da das Jupyter-Notebook Format standardisiert und universell verbreitet ist, kann Meyer ihre Programmcodes und Ergebnisse leicht mit Kolleg:innen weltweit teilen, auch über GitLab und ähnliche Dienste. Ihre Kolleg:innen können im Jupyter-Notebook die Ergebnisse betrachten und den enthaltenen Programmcode nachvollziehen und selbst ausführen. Verwenden die Kolleg:innen selbst JupyterHub.NRW, dann können sie dank der vorinstallierten wissenschaftlichen Softwarepakete und Arbeitsumgebung sofort mit dem Notebook arbeiten und müssen selbst keine Software installieren.
Damit Frauke D. Meyer den Machine-Learning-Algorithmus gut trainieren kann, braucht sie viele Daten – in Summe über 50 TB. Zum Glück muss Meyer keinen eigenen Objektspeicher kaufen, sondern kann über Coscine auf den DataStorage zugreifen und auf dieser großen und stabilen Plattform ihr Datenmanagement und die Datenablage organisieren. Meyer legt daher ihr Projekt in Coscine an und lädt die anderen PIs als Projekteigentümer:innen sowie ihre Doktorand:innen als Projektmitglieder ein. Ihre internationalen Projektmitglieder aus den USA und Japan kann Meyer dank des Logins via ORCiD ebenfalls zum Projekt einladen und ihnen Zugriff auf die Daten ermöglichen. Um den kostenlosen Speicherplatz zu erhalten, muss Meyer ein Metadatenprofil für Ihre Dateien auswählen – nur so können ihre Dateien gemäß der FAIR-Prinzipien gespeichert werden. Sie wendet sich zur Unterstützung bei der Erstellung des passenden Metadatenprofils an NFDI4DataScience und wird durch einen Data Steward unterstützt. Nach der Erstellung des Metadatenprofils wird ihr Coscine Speicherplatz-Antrag über 50 TB bewilligt und Meyer lädt über ein Python Skript ihre Dateien inklusive Metadaten automatisiert über Coscine auf den DataStorage hoch. Andere Projektmitglieder mit weniger Programmiererfahrung und kleineren Datenmengen nutzen dafür einfach den Upload über die Coscine-Weboberfläche. Der projektbezogene Software-Code aus GitLab wird über Coscine ebenfalls allen Projektmitgliedern zur Verfügung gestellt und mit Metadaten beschrieben. Die von Coscine vergebenen projekt- und ressourcenspezifischen PIDs nutzt Meyer zum Referenzieren ihrer Forschungsdaten außerhalb von Coscine – z.B. in Preprints. Nach Abschluss ihres Projekts speichert Frauke D. Meyer ihre Daten in Coscine für 10 Jahre. Dank der angegebenen Metadaten findet Meyer im Rahmen eines nachfolgenden Projekts passende Daten über die Suchfunktion von Coscine wieder und kann sie nachnutzen.
Im Laufe des Projekts hat Frauke D. Meyer ein Set von 250 GB Daten in Coscine zusammengestellt, das im Rahmen eines ersten Papers inklusive DOI publiziert werden soll. Da Coscine speziell für die aktive Projektphase konzipiert wurde, kann Meyer ihre Daten dort nicht publizieren. Zur Unterstützung bei der Publikation ihrer Daten schickt Meyer daher ihre Projekt-Metadaten aus Coscine direkt an ihre Bibliothek. Diese unterstützt sie ein geeignetes Repositorium zur Publikation zu finden. Da es für Meyers Forschungsschwerpunkt kein passendes fachspezifisches Repositorium und auch kein spezifisches Data Center gibt, empfiehlt ihr die Kuratorin ihrer Hochschulbibliothek das über den Landesdienst bereitgestellte Forschungsdatenrepositorium ihrer Hochschule. Das Repositorium ermöglicht ihr, die Forschungsergebnisse zu publizieren und automatisch mit einer DOI zu versehen. Aufgrund der Anbindung des institutionellen Repositoriums an den Metadatenkatalog für Forschungsdaten des Landes wird ihre Publikation indexiert und ist so für andere Forscher:innen gut aufzufinden und zitierbar. Über das Repositorium wird zudem eine Nachnutzung der von Meyer bereitgestellten Forschungsdaten in weiteren Projekten möglich, wobei auf Basis der veröffentlichten Nutzungslizenz die Urheberschaft und Herkunft der Forschungsdaten jederzeit erkennbar ist. Frauke D. Meyer kommt zugleich der Vorgabe des Forschungsförderers nach, die im Projekt erzeugten Forschungsdaten im Open Access zu publizieren.
Um sicherzustellen, dass ein Teil der Daten auch in mehr als 10 Jahren noch für wissenschaftliche Forschung verfügbar ist, werden sie in die Langzeitverfügbarkeit (LZV) überführt. Dafür nimmt Meyer ebenfalls Kontakt zu ihrer Bibliothek auf, um den Transfer zu veranlassen. Da die Hochschulbibliothek ein Kooperationspartner der Landesinitiative LZV.nrw ist und das Repositorium an die LZV-Infrastruktur angebunden hat, wurden die im Repositorium veröffentlichten Daten automatisch in die LZV überführt. Meyer bespricht nun mit ihrer Kuratorin, welche der bisher unveröffentlichten Forschungsdaten aus der Projektphase ebenfalls langzeitverfügbar gehalten werden sollen. Nachdem die relevanten Daten identifiziert worden sind, prüft die Kuratorin, ob bereits jetzt Risiken hinsichtlich der Dateiformate vorliegen und ob alle notwendigen Metadaten wie bspw. Nutzungsrechte, signifikante Eigenschaften der Forschungsdaten und Strukturinformationen vorhanden sind. Nachdem Meyer der Bibliothek die benötigten Rechte zur LZV eingeräumt hat, transferiert die Bibliothek auch die unveröffentlichten Forschungsdaten in die LZV-Infrastruktur.
Und damit ist wieder ein Forschungsprojekt erfolgreich abgeschlossen. Aber Frauke D. Meyer hat schon wieder viele neue Ideen mit ihre Kolleg:innen auf Sciebo gesammelt.
FAQs zu den FDM-Landesdiensten in NRW
Welche Landesdienste gibt es schon? Was kann ich wofür benutzen? Wo finde ich weitere Informationen? Wenn auch Sie wie Frauke D. Meyer die FDM-Landesdienste für Ihre Forschung benutzen wollen, haben Sie sicherlich viele Fragen. Hier finden Sie einige erste Antworten und den Weg direkt zu den Expert:innen.
Allgemein
- Welche Landesdienste gibt es aktuell?
Die FDM-Landesdienste befinden sich aktuell im Aufbau. Welche Dienste es geben soll ist im FDM-Landeskonzept beschrieben.
Dienst wird bereits an den Hochschulen in NRW genutzt | Dienst wird derzeit an den Hochschulen in NRW eingeführt | Dienst ist im Aufbau | Dienst soll aufgebaut werden |
Sciebo | Coscine & DataStorage.nrw | git.nrw | Repositoriendienst |
LZV | JupyterHub.nrw | FD-Metadatenkatalog |
- Wer kann die Landesdienste nutzen?
Die FDM-Landesdienste richten sich an die Forschenden der Mitgliedshochschulen der DH.NRW. Andere Institutionen können mit den Diensten in Verhandlung treten und eigene Verträge aufsetzen.
- Wie kann ich herausfinden, welche Dienste an meiner Hochschule zugänglich sind?
Einige Dienste sind bereits verfügbar und werden von vielen Forschenden auch schon genutzt, andere werden derzeit aufgebaut oder konzeptioniert. Die Landesinitiative fdm.nrw organisiert regelmäßig Informationsangebote für die Hochschulleitungen und das Personal im Forschungsdatenmanagement. Über ihren eigenen, aktuellen Entwicklungsstand informieren die jeweiligen Landesdienste. Als Hochschulangehörige wenden Sie sich an ihre lokale FDM-Servicestelle oder Ansprechperson.
- Warum sind nicht alle Dienste, die es bereits gibt, auch an meiner Institution verfügbar?
Die FDM-Landesdienste sind ein Infrastrukturangebot für die Mitgliedhochschulen der DH.NRW. Die Hochschulen können selber entscheiden, ob sie dieses Angebot ihren Forschenden verfügbar machen möchte. Wenn sie sich dazu entscheidet, müssen Verträge zwischen den jeweiligen Landesdiensten und den Hochschulen aufgesetzt werden. Dieser Prozess hängt von vielen Faktoren ab und dauert erfahrungsgemäß eine gewisse Zeit, bis alle technischen und juristischen Themen geklärt sind. In manchen Fällen können Dienste auch über die ORCiD mit eingeschränktem Funktionsumfang genutzt werden.
- Wen kann ich an meiner Hochschule ansprechen, um mehr über die Dienste und das FDM zu erfahren?
Die meisten Hochschulen in NRW haben eigene FDM-Servicestellen eingerichtet oder Ansprechpersonen zum FDM eingestellt. Das Forschungsdatenmanagement ist häufig in hochschulübergreifenden Einrichtungen angesiedelt, wie den Bibliotheken, Rechenzentren oder der Forschungsförderung. An Hochschulen für Angewandte Wissenschaften sind die Ansprechpersonen zum FDM in manchen Fällen im Präsidium angestellt.
Sciebo.nrw
- Was ist Sciebo?
Sciebo ist ein nicht-kommerzieller Sync-and-Share-Dienst. Die Daten werden auf Servern der Universität Münster gespeichert. Somit haben Externe keinen unbefugten Zugriff auf die Daten. Funktionell ist der Haupteinsatzzweck die Synchronisation von Daten zwischen den eigenen Geräten (Desktopcomputer, Laptops, Smartphones, über das Webinterface auch beliebige andere Computer mit einem Browser) sowie mit Kolleg:innen und Externen. Über den integrierten Dokumenteneditor können auch gemeinsam Office-artige Dokumente bearbeitet werden.
- Kann ich Sciebo bereits benutzen?
Sciebo steht allen Hochschulen in NRW offen. Dort können sich alle Nutzenden, die als Studierende oder Mitarbeitende dem IDM bekannt sind, bei Sciebo registrieren. Falls Ihre NRW-Hochschule noch keinen Zugriff auf Sciebo hat, nehmen Sie gerne über Ihr Rechenzentrum Kontakt zu uns auf.
- Wann benutze ich Sciebo?
Die Nutzung von Sciebo bietet sich insbesondere zur Synchronisation von Daten zwischen den eigenen Geräten und zur Kollaboration mit Kolleg:innen an. Auch ohne die Verwendung mehrerer Geräte kann es sich wegen der integrierten Versionierung lohnen, die Daten über den Desktopclient mit Sciebo zu synchronisieren.
- Wann benutze ich Sciebo nicht?
Wenn die Daten die maximale Größe einer Projektbox von 2 TB überschreiten, ist Sciebo nicht mehr die richtige Lösung. Auch als Archiv ist Sciebo nicht geeignet, da nach Ablauf einer Kulanzfrist die Daten mit dem Ausscheiden einer Person aus der Hochschule gelöscht werden.
- Wo finde ich weitere Informationen zu Sciebo?
Informationen zu Sciebo sind auf der Webseite zu finden. Dort sind auch die Antworten auf die häufigsten Fragen zu finden.
git.nrw
- Was ist git.nrw?
Der Service git.nrw ist eine NRW-weit nutzbare GitLab Instanz für alle Angehörigen und Mitglieder der Hochschulen der DH.NRW. Die Plattform GitLab versteht sich als komplette Software-Lifecycle Lösung und eignet sich zum Entwickeln von Code, aber auch zur Verwaltung von Forschungsdaten.
- Kann ich git.nrw bereits benutzen?
Aktuell befindet sich der Landesdienst git.nrw im Aufbau und soll nach einer Testphase allen Mitgliedshochschulen der DH.NRW bis Sommer 2026 angeboten werden.
- Wann benutze ich git.nrw?
Die zukünftig durch git.nrw bereit gestellte Plattform GitLab eignet sich zur Versionierung, Verwaltung und Publizierung von Software-Code und (Forschungs-)Daten sowie zum Projektmanagement. Durch die NRW-weite Bereitstellung kann git.nrw sowohl für eigene Projekte als auch für Kooperationsprojekte mit anderen Hochschulen genutzt werden.
- Wann benutze ich git.nrw nicht?
Durch eine Beschränkung der Projektgröße ist git.nrw nicht geeignet, um einen Daten- oder Dokumentenaustausch vorzunehmen. Ebenso stellt die Plattform keinen Speicherort für private Daten oder Medien dar. Für die (Langzeit-)Speicherung von größeren Datenmengen sollte auf bestehende andere Landesdienste zurückgegriffen werden. Eine Visualisierung der Datensätze ist git.nrw ebenfalls nur bedingt möglich, da es primär für einfache Textdateien und Softwareentwicklungsprojekte konzipiert wurde.
- Wo finde ich weitere Informationen zu git.nrw?
Eine eigene Projektseite existiert zum jetzigen Zeitpunkt noch nicht. Informationen zu git.nrw finden Sie aktuell auf den Seiten der DH.NRW
JupyterHub.nrw
- Was ist Jupyter?
Jupyter Notebooks sind ein modernes Werkzeug zur interaktiven Analyse und Visualisierung von Forschungsdaten. Mit Hilfe dieser Notebooks lassen sich Analysen leicht dokumentieren und anderen Personen zur Verfügung stellen. JupyterHub.NRW stellt eine vorinstallierte Arbeitsumgebung bereit, mit der Jupyter Notebooks bequem im Webbrowser bearbeitet und auf leistungsstarken Rechnern in der Cloud ausgeführt werden können.
- Kann ich JupyterHub.nrw bereits benutzen?
Einige Universitäten betreiben bereits eigene JupyterHub-Dienste. JupyterHub.NRW wird bald einen Testbetrieb starten.
- Wann benutze ich Jupyter und JupyterHub.NRW?
In der Forschung kann man mit Jupyter Notebooks explorativ arbeiten, um zu Beginn eines Datenanalyse-Projekts schnell einen Überblick über die Daten zu bekommen. Neben der Notebook-Oberfläche bietet JupyterHub.NRW auch eine vollwertige Software-Entwicklungsumgebung, so dass auch hochkomplexe Analysen realisierbar sind. In der Lehre bietet JupyterHub.NRW den Studierenden eine vorinstallierte Arbeitsumgebung zur Nutzung in Kursen und zur Bearbeitung von Hausaufgaben und Hausarbeiten. In Zukunft soll es möglich sein, dass Studierende ihre Kursaufgaben direkt in JupyterHub.NRW abgeben und Lehrende sie dort bewerten.
- Wann benutze ich JupyterHub.NRW nicht?
JupyterHub.NRW eignet sich besonders gut für interaktive Analysen kleiner bis mittlerer Datenmengen. Für die nicht-interaktive Verarbeitung sehr großer Datensätze sollten entsprechende HPC-Systeme genutzt werden. JupyterHub.NRW ist kein Cloud-Speicher. Es können zwar Daten gespeichert werden, der Speicherplatz ist jedoch begrenzt. Zum Speichern und Teilen von Daten können Sciebo oder Coscine verwendet werden. Der Zugriff auf Sciebo ist von JupyterHub.NRW aus möglich.
- Wo finde ich weitere Informationen zu Jupyter?
Informationen zu JupyterHub.NRW gibt es demnächst auf der Website des Dienstes. Eine Übersicht über einige bereits vorhandene JupyterHub-Installationen gibt es hier. Ausführliche Informationen zum Jupyter-Ökosystem gibt es auf der offiziellen Website des Projekts.
Coscine.nrw
- Was ist Coscine?
Coscine ist eine Forschungsdatenmanagement-Plattform für Forschungsprojekte. Coscine ermöglicht für Forschungsprojekte den Zugriff auf Speicherplatz des DataStorage.nrw unter Gewährleistung der FAIR-Prinzipien. Zusätzlich können projektbezogene GitLab-Repositorien eingebunden und externe Dateien verlinkt werden. Die Anmeldung erfolgt über die eigene Organisation oder ORCiD. In Coscine angelegte Projekte ermöglichen ein Rollenmanagement, Metadatenmanagement, das Teilen und Referenzieren von Dateien und die Archivierung von Forschungs- und Metadaten für 10 Jahre.
- Kann ich Coscine bereits benutzen?
Ja, jede Person mit einer ORCiD kann sich in Coscine einloggen und Projekte anlegen bzw. zu Projekten eingeladen werden.
- Wann benutze ich Coscine?
Während der aktiven Projektphase, um Zugriff auf Speicherplatz zu erhalten (insbesondere, wenn ein Projekt große Dateien / Datensätze umfasst) und zur Archivierung der Forschungs- und Metadaten 10 Jahre nach Projektende. Zudem bietet sich Coscine bei Projekten über Organisationen hinaus an, da Dateien niederschwellig und unabhängig von einer Organisationszugehörigkeit geteilt werden können. Zusätzlich sollte Coscine genutzt werden, wenn die Einhaltung der FAIR-Prinzipien in der jeweiligen Forschungsförderung verlangt wird.
- Wann benutze ich Coscine nicht?
Coscine ermöglicht keine synchronisierte Zusammenarbeit an Dateien, wie z.B. Textdokumenten. Auch eine Publikation von Forschungsdaten (via DOI) oder Langzeitarchivierung (mehr als 10 Jahre nach Projektende) ist nicht möglich.
- Wo finde ich weitere Informationen zu Coscine?
Auf der Website und der dort zu findenden Dokumentation und FAQs.
DataStorage.nrw
- Was ist DataStorage.nrw?
DataStorage.nrw ist die Speicherplattform unter Coscine für aktive Daten. Technisch handelt es sich um einen auf vier Hochschulen verteilten Objektspeicher. Durch die räumliche Verteilung und eine geeignete Speicherung sind hier gespeicherte Daten praktisch gegen jede Naturkatastrophe geschützt. Zusätzlich garantiert der Speicher, dass ein über Coscine gesetztes „Retention Flag“ vor Ablauf der eingestellten Zeit unwiderruflich ist, so dass auch gegen Cyber-Angriffe ein sehr hoher Schutz besteht.
- Kann ich DataStorage.nrw bereits benutzen?
Die Nutzung erfolgt über Coscine. Sobald der Speicher dort sichtbar ist, kann er genutzt werden.
- Wo finde ich weitere Informationen zum DataStorage.nrw?
DataStorage.nrw ist ein wichtiger Baustein im Kontext der FDM-Landesdienste in NRW. Dieser Baustein stellt jedoch keinen eigenständigen, separat nutzbaren Service dar; vielmehr sollen Bewirtschaftung und Nutzung derzeit ausschließlich über Coscine erfolgen. Aus diesem Grund wird auf eine eigenständige Beschreibung dieser Komponente bewusst verzichtet.
Repositorien
- Was sind Repositorien?
Repositorien dienen der strukturierten Ablage und der Auffindbarkeit von Publikationen digitaler Objekte. Dies können alle Arten von Forschungsergebnissen (z.B. Fachartikel, Forschungsdaten oder unterstützende Materialien) sein. Neben den eigentlichen Daten werden in einem Repositorium auch Metadaten abgelegt oder automatisiert erzeugt, um die Daten zu beschreiben und sie auffindbar und identifizierbar zu halten.
- Wie finde ich das richtige Repositorium um meine Daten zu publizieren?
Aus wissenschaftlicher Perspektive eignen sich zunächst fachspezifische Repositorien zur Publikation von Daten. Diese sind in der Community bekannt, verfügen idealerweise über eine entsprechende Reputation in der Disziplin und berücksichtigen u.a. auch fachspezifische Metadatenstandards. Da es entsprechende Fachrepositorien nicht für jede wissenschaftliche Disziplin gibt, bieten viele Hochschulen eigene institutionelle Repositorien an. Über die Möglichkeiten zur Nutzung und Auswahl von Repositorien informiert in der Regel die Hochschulbibliothek vor Ort.
- Wird es einen Repositorien-Landesdienst geben?
Da der Betrieb eines Forschungsdatenrepositoriums aufwendig und technisch komplex ist, können nicht alle Hochschulen ihren Wissenschaftler:innen ein institutionelles Repositorium zur Verfügung stellen. Um diese Lücke zu füllen, wird im Kontext der DH.NRW derzeit ein entsprechender Landesdienst geplant.
- Wann benutze ich Repositorien?
Die Nutzung eines Repositoriums ist immer dann sinnvoll, wenn ein Datenbestand strukturiert und identifizierbar abgelegt werden soll. Darüber hinaus besteht in einem Repositorium die Möglichkeit, Daten zu veröffentlichen und mit eindeutigen Identifikatoren (bspw. DOI) zu versehen. Eine eigene ORCiD kann dafür genutzt werden, die Publikation im Repositorium dem eigenen wissenschaftlichen Output zuzuordnen.
- Wann benutze ich Repositorien nicht?
Repositorien eignen sich in der Regel nicht, wenn die Daten noch aktiv erhoben oder bearbeitet werden.
- Wo finde ich weitere Informationen zu Repositorien?
Ansprechpartner:innen zur Möglichkeit, Daten in Repositorien abzulegen und zu veröffentlichen, finden Sie in Ihrer Hochschulbibliothek.
Langzeitverfügbarkeit (LZV)
- Was ist Langzeitverfügbarkeit (LZV)?
Ziel der Langzeitverfügbarkeit (LZV) ist der zeitlich unbegrenzte und authentische Erhalt von Informationen in digitaler Form, um diese inhaltlich und technisch interpretierbar für die Nachnutzung zu erhalten. D.h. unter LZV wird keine archivarische Tätigkeit im eigentlichen Sinne verstanden, sondern die Umsetzung geeigneter konzeptioneller und technischer Maßnahmen zur Verfügbarhaltung des digitalen Wissens. Der Erhalt der intendierten Aussage (Authentizität) und die einfache Interpretierbarkeit der Informationen stehen im Mittelpunkt. Ein Beispiel für eine konkrete Maßnahme ist die Migration eines veralteten Dateiformats in ein neues Format.
- Kann ich Langzeitverfügbarkeit (LZV) bereits benutzen?
Voraussetzung für die Nutzung der LZV-Infrastruktur ist eine Kooperationsvereinbarung der jeweiligen Hochschule mit der Landesinitiative LZV.nrw. In der Regel ist die lokale Hochschulbibliothek der geeignete Ansprechpartner, um sich über die LZV-Möglichkeiten an der Hochschule zu informieren.
- Wann benutze ich Langzeitverfügbarkeit (LZV)?
Forschungsdaten und wissenschaftliche Publikationen langfristig verfügbar zu halten, ist immer dann relevant, wenn die Daten potenziell eine Relevanz für künftige Wissenschaftsgenerationen haben können. Aufwände und Kosten, die bei der Reproduktion von Forschungsdaten anfallen würden, sind ebenfalls ein wichtiges Kriterium. Manche Forschungsdaten sind wegen ihrer Abhängigkeit von Umweltfaktoren nicht reproduzierbar (Wetterdaten, Umfragen zu gesellschaftlichen Ereignissen, etc.). Diese stellen einen besonderen Wert für die künftige Forschung dar.
- Wann benutze ich Langzeitverfügbarkeit (LZV) nicht?
LZV ist kein geeigneter Ersatz für die Datensicherung im Sinne eines Backups, auf das bei Datenverlust schnell und einfach zuzugreifen ist. LZV wird nicht für eine reine Speicherung über 10 Jahre im Sinne der guten wissenschaftlichen Praxis benötigt. LZV ist ungeeignet zur Aufbewahrung verschlüsselter Daten oder Daten, denen keine Nutzungsinformationen anhaften, da beides die Nachnutzung in der Zukunft stört oder ganz verhindert. LZV eignet sich nicht zur langfristigen Präsentation der Daten, da es sich um ein sogenanntes DarkArchive handelt. D.h. lediglich autorisierte Personen aus der jeweiligen Hochschule haben Zugriff auf die eingelieferten Objekte und kuratieren diese für die Nutzung über Drittsysteme.
- Wo finde ich weitere Informationen zu Langzeitverfügbarkeit (LZV)?/ Wo kann ich mich weiter über Langzeitverfügbarkeit (LZV) informieren?
Weitere Informationen zur Langzeitverfügbarkeit und zur Landesinitiative finden Sie hier.
Informationen zur Nachnutzung
Die fiktionale Geschichte und Antworten der FAQs wurden gemeinsam mit Mitarbeitenden der Landesdienste erarbeitet.
Bilder auf dieser Seite stammen aus dem Projekt FDM@Studium.nrw. Weiteres Bildmaterial zur Nachnutzung finden Sie hier.
Die Texte und Bilder auf der Webseite von fdm.nrw stehen unter der CC BY 4.0-Lizenz.