« Projekte
Deutsch - US-amerikanische Kooperation in Computational Neuroscience: Datagit - Kombination von Katalogen, Datenbanken und Verteilungslogistik in eine Daten-Distribution
Projekthomepage:
Finanzierung:
Bund;
Ziel dieses Projektes ist es, die technischen Schwierigkeiten bei der Verbreitung und Nachnutzung von wissenschaftlichen Originaldaten auszuräumen, um so die Zusammenarbeit unabhängiger Arbeitsgruppen im schrittweisen Forschungsprozess zu verbessern. Dazu wird das erfolgreiche Modell einer Software-Distribution zur Anwendung beim "data-sharing" adaptiert. Analog zum Software-Pendant werden alle Komponenten einer "Daten Distribution" entwickelt: Datenpaket-Manager, Paket-Archiv, Schnittstellen für automatisierte und interaktive Nutzung. Die Arbeiten basieren auf zwei Grundprinzipien: 1) Nutzung existierender, unabhängiger Daten-Hosting Dienstleister als Fundament für eine dezentrale data-sharing Plattform. 2) Nutzung einer bereits etablierten Software für Datenverwaltungs- und -transport-Logistik: git-annex, welche wiederum auf dem weit verbreiteten GitVersionskontroll-System aufbaut. Das fertige System "DataGit" wird es erlauben, mit einer einzigen Schnittstelle auf eine große Bandbreite von Daten zugreifen zu können - von einer einzelnen Datei auf dem Webserver einer Arbeitsgruppe bis hin zu großen Datensammlungen auf Portalen wie openfmri.org. DataGit ist kompatibel mit allen Betriebssystemen und präsentiert Nutzern den Datenzugriff nach vertrauten Konzepten wie Dateien und Verzeichnissen, während Nutzerautorisierung und Datentransport transparent abgewickelt werden.

Schlagworte

Data Distribution, Git, data-sharing, git-annex, open-source

Kooperationen im Projekt

Kontakt

weitere Projekte

Die Daten werden geladen ...