Site icon GESIS Blog

Datenspenden als Erhebungsmethode: Neue Wege zu digitalen Verhaltensdaten

A person using a tablet with a colorful 'DONATE' button displayed on the screen.

Digitale Verhaltensdaten, sogenannte Digital Behavioral Data, sind zu einem zentralen Bestandteil sozialwissenschaftlicher Forschung geworden. Lange Zeit konnten Forschende solche Daten über Programmierschnittstellen, die sogenannten APIs, kommerzieller Online-Plattformen erheben. Doch da viele Plattformen ihren Datenzugang in den letzten Jahren deutlich eingeschränkt haben, werden alternative Erhebungsmethoden zunehmend wichtig. Eine dieser neuen Strategien ist die Datenspende, die in den Sozialwissenschaften und der Computational Social Science an Relevanz gewinnt. Im Dezember 2024 hat GESIS dazu die Arbeitsgruppe Datenspenden gegründet, die nun einen umfassenden internen Bericht zu Datenspenden als Erhebungsmethode vorgelegt hat. Die AG vereint Expertise aus mehreren Abteilungen und wird rechtlich begleitet, um den verantwortungsvollen Umgang mit Datenspenden sicherzustellen. Erste Pilotstudien wurden bereits umgesetzt; ein kontinuierlicher Austausch und die Beobachtung aktueller Entwicklungen stehen ebenfalls im Fokus.

Digital behavioral data has become a central component of social science research. For a long time, researchers were able to collect such data via the application programming interfaces (APIs) of commercial online platforms. However, as many platforms have significantly restricted access to their data in recent years, alternative data collection methods are becoming increasingly important. One of these new strategies is data donation, which is gaining relevance in the social sciences and computational social science. In December 2024, GESIS established the Data Donations Working Group, which has now presented a comprehensive internal report on data donations as a data collection method. The working group brings together expertise from several departments and receives legal guidance to ensure the responsible handling of data donations. Initial pilot studies have already been conducted; ongoing dialogue and monitoring of current developments are also key priorities.

DOI: 10.34879/gesisblog.2026.117


Wie Datenspenden funktionieren

Datenspenden gehen von einem nutzendentrierten Ansatz aus. Nicht mehr die Online-Plattformen selbst stellen die Daten bereit, sondern die Nutzenden fordern ihre Daten an und geben sie freiwillig für wissenschaftliche Zwecke weiter. Rechtlich basiert dieser Vorgang auf Art. 15 der Datenschutzgrundverordnung (DSGVO), der das Recht auf Auskunft über die eigenen Informationen garantiert. Nutzende können eine Kopie der gespeicherten Daten in einem maschinenlesbaren Format erhalten. Einige Plattformen bieten dafür inzwischen eigens Download-Funktionen an. Bei den Daten handelt es sich um im Alltag entstandene Daten, wie beispielsweise die eigene Suchhistorie, gesehene Social Media-Posts oder die Nutzung von Streamingdiensten. Als Datenspende bezeichnet man entsprechend die Weitergabe dieser Daten für Forschungszwecke. Die Spenden basieren auf einer informierten, aktiven Entscheidung der Teilnehmenden. Die wissenschaftliche Nutzung der gespendeten Daten wird durch Prinzipien wie Datenminimierung und einer frühzeitigen Entfernung personenbezogener Merkmale datenschutzrechtlich und forschungsethisch abgesichert. Inhaltlich eröffnen Datenspenden neue Perspektiven, da sie eine Erweiterung von Forschungsfragen in diversen sozialwissenschaftlichen Disziplinen ermöglichen. Methodisch bieten Datenspenden die Chance, Umfragedaten durch objektive Verhaltensdaten zu ergänzen oder zu validieren. Hinzu kommt, dass Plattformdaten oft bereits strukturiert vorliegen und damit weniger aufwändig in der Verarbeitung sind.

Literaturüberblick und empirische Studien

Ein systematischer Literaturüberblick der GESIS AG identifizierte 35 empirische Datenspendestudien und 28 Studien zur Datenspendebereitschaft. Es zeigte sich, dass die Bereitschaft zur Datenspende in Studien mit einer nur hypothetischen Datenerhebung zwar bei circa 58 % liegt, aber in tatsächlichen Datenerhebungen nur etwa 38 % der Teilnehmenden Daten spenden. Die Lücke zwischen berichteten Einstellungen und tatsächlichem Verhalten ist also erheblich. Die Spenderdaten fallen vor allem in Online-Panels, bei On-Site-Erhebungen mit persönlicher Unterstützung sowie in Crowdsourcing-Kampagnen höher aus. Der Erfolg ist geringer, wenn zwischen der Anforderung und dem Erhalt der Datenpakete Wartezeiten entstehen oder wenn die Stichproben im Durchschnitt älter sind. In mehreren der empirischen Studien setzte die GESIS AG das verbreitete Framework „Port“ ein, das eine lokale Datenminimierung im Browser der Teilnehmenden ermöglicht und nur relevante, verschlüsselte Forschungsdaten überträgt. Erprobt wurden beispielsweise Datenspenden aus WhatsApp-Chatverläufen, ChatGPT-Konversationen, Google-Suchverläufen und Spotify-Streamingdaten in unterschiedlichen Stichproben und Erhebungskontexten. Unter anderem zeigten die diversen Studien, dass die Betonung des gesellschaftlichen Nutzens die Zustimmung zur Datenspende erhöht und finanzielle Incentives die tatsächliche Spendenquote steigerten. Je nach Datentyp zeigten sich auch Variablen, wie das Vertrauen in die Wissenschaft, als positive Einflussfaktoren für die Spende. Insgesamt bestätigen die Studien die Diskrepanz zwischen Einstellung und Verhalten. Die Menge der erhobenen digitalen Verhaltensdaten zeigt zugleich das erhebliche analytische Potenzial selbst bei nur moderaten Spendenraten auf.

Observatory for Platform Audits

Mit dem Ziel, den Spendeprozess weitgehend zu automatisieren, entwickelt GESIS gemeinsam mit dem Max-Planck-Institut für Softwaresysteme das „Observatory for Platform Audits“ (OPA). Bei OPA loggen sich die Teilnehmenden einmalig in ein zentrales Dashboard ein und können dann Datenpakete über die Portability-Schnittstellen der Plattformen automatisiert abrufen. Die Daten werden für sie in einer geschützten Umgebung gespeichert, standardisiert ausgewertet und visualisiert. Die Teilnehmenden können ihre Daten inspizieren und anschließend für die Forschung freigeben. OPA soll technische Hürden reduzieren, den Aufwand für Teilnehmende minimieren und perspektivisch sogar kontinuierliche Datenspenden ermöglichen. Geplant ist zunächst eine Pilotstudie im Rahmen des GESIS Panel.dbd und die technische Ausweitung auf große Online-Plattformen nach der Definition des Digital Services Act.

Langfristige Archivierung von Datenspenden

Im Rahmen der AG hat GESIS seine Arbeiten an der langfristigen Archivierung von Datenspenden     begonnen. Große Datenmengen, plattformspezifische Variablenstrukturen, potenziell sensible Inhalte und das Vorhandensein von Personenbezügen erfordern angepasste Standards und Prozesse. Am Beispiel von Google- und Spotify-Daten werden derzeit bei GESIS neue Workflows erprobt. Diese reichen von der rechtlichen Klärung im sogenannten Pre-Ingest über standardisierte Prüfprozesse beim Data Ingest bis hin zur sicheren Bereitstellung in einer Trusted Research Environment. Dafür wird das GESIS Secure Data Center entsprechend ausgebaut, um bereits in diesem Jahr einen gesicherten Fernzugriff auf die Daten zu ermöglichen.

Potenziale und Herausforderungen

Datenspenden bieten großes analytisches Potenzial, insbesondere durch die Verknüpfung von Verhaltens- und Befragungsdaten. Gleichzeitig bringen sie jedoch auch Herausforderungen mit sich. So führen mehrstufige Prozesse für den Datendownload und -upload häufig zum Abbruch des Spendenvorgangs. Auch ändern Plattformen ihre Datenformate teils unvorhersehbar, was technische Anpassungen erforderlich macht. Zudem ist die Teilnahme selektiv und hängt unter anderem von Alter, Bildung, digitalen Kompetenzen und der jeweiligen Plattformnutzung der Studienteilnehmenden ab.

Ausblick

Datenspenden entwickeln sich zu einem relevanten Feld der sozialwissenschaftlichen Forschung. Neben dem technischen Ausbau von Infrastrukturen durch nutzendenfreundliche und automatisierte Prozesse ist eine aktive Begleitung der regulatorischen Entwicklungen entscheidend, um den wissenschaftlichen Datenzugang zu sichern. Dabei wird es eine zentrale Aufgabe sein, die Lücke zwischen erklärter Bereitschaft und tatsächlicher Spende durch bessere Usability und gezielte Incentives zu verringern. Gleichzeitig gilt es, die Qualität von Studiensamples methodisch zu verbessern und das Potenzial gespendeter Verhaltensdaten in Kombination mit Befragungsdaten auszuschöpfen. Konkret wird GESIS das Framework OPA weiter entwickeln und ein institutionelles Angebot für Datenspenden aufbauen.

Dieser Beitrag basiert auf dem internen Bericht “Datenspenden als Erhebungsmethode. Bericht der AG Datenspenden @ GESIS” der GESIS-Arbeitsgruppe Datenspenden, der Sebastian Stier, Vanessa Lux, Barbara Binder, Johannes Breuer, Sina Chen, Carina Cornesse, Jessica Daikeler, Constantin Hammer, Julian Kohne, Simon Kruschinski, Joachim Piepenburg, Jan Schwalbach und Katrin Weller angehören.
Er wurde mit Unterstützung von ChatGPT 4.1 von Inke Ammermann und Sophie Zervos erstellt.

Exit mobile version