Reproduzierbarkeit leicht gemacht – „GESIS Notebooks“ für eine offene Wissenschaft

Die „GESIS Notebooks“ versetzen Wissenschaftler*innen in die Lage, hochkomplexe Forschungsprozesse mit wenig Aufwand und größtmöglicher Unterstützung nachzuvollziehen. In einer web-basierten interaktiven Arbeitsumgebung lassen sich komplexe Rechenprozesse virtuell durchführen, ohne eine leistungsstarke und teure Hardwareinfrastruktur selbst vorhalten zu müssen. Dadurch wird die Reproduzierbarkeit von Forschung deutlich einfacher; somit unterstützen die „GESIS Notebooks“ das Einhalten des Kodex der guten wissenschaftlichen Praxis.

The “GESIS notebooks” enable scientists to reproduce highly complex research processes with little effort and the greatest possible support. In a web-based interactive working environment, complex computing processes can be performed virtually without having to maintain a powerful and expensive hardware infrastructure. This makes the reproducibility of research much easier; thus the “GESIS notebooks” support compliance with the code of good scientific practice.

DOI: 10.34879/gesisblog.2020.12


In den ersten Wochen der europäischen Coronakrise machten fast täglich Meldungen die Runde, die von neuen medizinischen Studien berichteten, dank derer schnelle Hilfe für die Bevölkerung in Aussicht gestellt wurde. Mal handelte es sich um die Arbeiten an einem Impfstoff, mal um die Erfahrungen mit Immunisierung gegen das Coronavirus. Allen Meldungen gemein war die Randnotiz, dass die Studien noch von unabhängigen Wissenschaftler*innen überprüft werden müssten. So führte die Coronakrise noch einmal deutlich vor Augen, was nicht nur für die Medizin, sondern auch für die Sozialwissenschaften und für die Wissenschaft im Allgemeinen von immenser Bedeutung ist: die Reproduzierbarkeit wissenschaftlicher Prozesse und Analysen. Nur mit vollständiger Nachvollziehbarkeit der geleisteten Forschungsarbeit und Verfügbarkeit des genutzten Datenmaterials lassen sich die Ergebnisse replizieren, testen und somit deren Gültigkeit nachweisen.

Die umfassende Dokumentation von Forschung zum Zweck der späteren Reproduzierbarkeit ist längst Teil der guten wissenschaftlichen Praxis. GESIS unterstützt diesen wissenschaftlichen Kodex selbstverständlich und bietet Wissenschaftler*innen zahlreiche infrastrukturelle Dienstleistungen an, um die Dokumentation des eigenen Forschungsschaffens optimal umzusetzen. So reicht unsere institutionelle  Unterstützung von der Vermittlung des Know-hows zu Forschungsdatenmanagement über die Möglichkeit, Forschungsdaten selbst zu archivieren, bis hin zur Open-Access-Veröffentlichung der Publikation auf unserem Repositorium, um nur einen knappen Ausschnitt aus dem GESIS-eigenen Portfolio zu nennen.

Gleichwohl steht die Wissenschaft im Allgemeinen und stehen die Sozialwissenschaften im Besonderen in der heutigen Zeit vor enormen Herausforderungen, speziell im Hinblick auf die erforderliche Reproduzierbarkeit. Publikationen und Studien enthalten zunehmend vielschichtige Analyseabläufe und immer komplexere statistische Modelle. Die Daten sind vor allem bei der Forschung mit Digitalen Verhaltensdaten bzw. im Umgang mit „Big Data“ enorm heterogen und umfangreich. Wissenschaftliche Prozesse sind sehr aufwendig, benötigen immer höhere Rechenkapazitäten und sind von Außenstehenden nur noch schwer zu durchschauen. Unter dem Strich ist die Forderung nach Reproduzierbarkeit häufig nur noch schwer zu erfüllen.

GESIS setzt mit seinem Angebot der „GESIS Notebooks“ genau an dieser Sollbruchstelle an. Die „GESIS Notebooks“ versetzen Wissenschaftler*innen in die Lage, hochkomplexe Forschungsprozesse mit wenig Aufwand und größtmöglicher Unterstützung nachzuvollziehen.

Wie funktioniert das?

In einer web-basierten interaktiven Arbeitsumgebung lassen sich nach einem einfachen Login komplexe Rechenprozesse virtuell durchführen, ohne eine leistungsstarke und teure Hardwareinfrastruktur selbst vorhalten zu müssen. Mit wenigen Klicks lassen sich archivierte Skripte suchen, finden und ausführen, die statistische Analyseverfahren für eigene oder Fremddaten in Gang setzen und in kürzester Zeit Ergebnisse produzieren.
Wissenschaftler*innen wird damit ein ressourcenschonender Weg der offenen Wissenschaft aufgezeigt: Das Angebot versetzt sie in die Lage, komplexe Analyseprozesse vom heimischen Wohnzimmer aus durchzuführen, ohne die Anschaffung teurer Hardware, ohne örtliche Einschränkung und ohne Erwerb kostenpflichtiger Lizenzen .Die damit verbundene Philosophie des „Ressourcen-Sharings“ schont ganz nebenbei Klima und Umwelt.

GESIS nutzt dafür das Ökosystem von Jupyter, einer Non-Profit-Organisation, die gegründet wurde, um „Open-Source-Software, offene Standards und Services für interaktives Arbeiten mit Dutzenden Programmiersprachen voran zu treiben“. Das hierauf aufbauende Angebot der „GESIS Notebooks“ wird im Rahmen der mybinder.org-Federation erbracht und ermöglicht eine virtuelle Arbeitsumgebung, die u.a. auch von Google Clouds und dem Turing Institute genutzt, unterstützt und weiterentwickelt wird. Mit der Nutzung und Unterstützung der genannten Open-Source-Lösungen begegnet unser Institut damit der Gefahr, dass proprietäre Alternativen die Möglichkeiten für eine offene und letztlich damit unabhängige Wissenschaft beschneiden. Als Teil der Open-Science-Bewegung wird auch der Bereich der Open Methodology durch die „GESIS Notebooks“ gefördert: GESIS wird für sozialwissenschaftliche Konstrukte (z.B. Messung von politischen Einstellungen) Aufgabenbeschreibungen und Testdatensätze bereitstellen, um die transparente Entwicklung von Analysemethoden zu unterstützen. Sozialwissenschaftler*innen können dann einfach auf neue Methoden zugreifen und sie Schritt für Schritt im Browser nachvollziehen. Die Performanz kann anhand von einheitlichen Testdatensätzen verglichen, auf eigene Datensätze angewendet oder für eigene Zwecke angepasst  und weiterentwickelt werden. So können entwickelte Methoden zur Aufbereitung und Analyse gut sichtbar angeboten, effizient nachgenutzt und modifiziert werden.

Die GESIS Notebooks erlauben es, Analyseprozesse per Skript auf eigene Daten aus empirischen Erhebungen anzuwenden. Selbstverständlich lassen sich auf diesem Weg auch Sekundäranalysen von bereits vorhandenem Datenmaterial durchführen. In diesem Zusammenhang bieten die „GESIS Notebooks“ reizvolle Perspektiven für Weiterentwicklungen. Sie haben das Potential, Forschungsdaten für Sekundäranalysen in einer direkten und einfachen Weise zur Verfügung zu stellen: Nutzende greifen vom heimischen PC auf die Daten zu, analysieren und nutzen sie zu wissenschaftlichen Zwecken, ohne sie herunterzuladen zu müssen.

Auch in der Lehre und ganz besonders vor dem Hintergrund zunehmender Digitalisierung von Lehrinhalten können die GESIS Notebooks die Vermittlung von Methoden empirischer Sozialforschung vereinfachen. So lassen sich vordefinierte Skripte im Rahmen der GESIS Notebooks archivieren und jederzeit wieder abrufen. Damit werden Lehrende in die bequeme Position versetzt, Lehrmaterial vorzubereiten und Studierenden ohne großen Aufwand verfügbar zu machen. Die Studierenden wiederum können mit wenigen Klicks sowohl auf aufwendige Analyseverfahren als auch auf umfangreiche Datensammlungen zugreifen, die sonst für sie nicht zur Verfügung stehen würden.

Das Angebot der „GESIS Notebooks“ leistet der Etablierung von Open Science Vorschub: Mit der so genannten „1-Click Reproducibility“, also der technischen Möglichkeit, mit nur einem Klick komplexe Analysen zu reproduzieren, wird eine Dynamik unterfüttert, die im Wissenschaftsbetrieb zu mehr Offenheit und Nachprüfbarkeit führt. Inzwischen verlangen viele sozial- oder wirtschaftswissenschaftliche Zeitschriften von ihren Autor*innen nicht nur ein fertiges Manuskript, sondern auch den maschinell lesbaren Code ihrer Analyseverfahren. Neu ist dieser Trend nicht; neu ist hingegen die Möglichkeit, diese Codeschnipsel einfach und unkompliziert ausführen und damit überprüfen zu können. Dadurch wird der Druck auf die Autor*innen erhöht, im Rahmen des Forschungsdatenmanagements der Reproduzierbarkeit ihrer Forschungsarbeit ausreichend Aufmerksamkeit zu schenken, um Bedingungen für wissenschaftliche Veröffentlichungen zu erfüllen. Mit technischen Infrastrukturangeboten wie den „GESIS Notebook“ wird so das Einhalten des Kodex der guten wissenschaftlichen Praxis einfacher und attraktiver.

In Zeiten existentieller Krisen, wie sie heutzutage mit dem Klimawandel und der Corona-Gefahr allgegenwärtig sind, ist die Infrastruktur für unabhängige und gewissenhafte Forschung unabdingbar. Nur so lässt sich wissenschaftlicher Fortschritt sichern, der letztlich den Weg aus der Krise aufzeigen kann.


Jetzt die GESIS Notebooks testen: https://notebooks.gesis.org/

Leave a Reply

This site uses Akismet to reduce spam. Learn how your comment data is processed.