Dienstagsdialog des Förderfonds Wissenschaft in Berlin

(Digital) Data is the new oil. What we can – and cannot – learn from Facebook, Google & Co.

7. Dezember 2021

 
Mit Prof. Dr. Emilio Zagheni

Direktor am Max-Planck-Institut für demografische Forschung, Professor of Sociology an der University of Washington in Seattle und External Affiliate am Center on the Economics and Demography of Aging an der UC Berkeley

Emilio Zagheni hält seinen Vortrag zum Thema "(Digital) Data is the new oil. What we can – and cannot – learn from Facebook, Google & Co.". Er beleuchtet verschiedene Aspekte der Nutzung neuer digitaler Daten in der Wissenschaft anhand von vielen anschaulichen Projekten aus dem Max-Planck-Institut für demografische Forschung.

Als Einstieg wählt Emilio Zagheni ein Bild von einem vor einem Zerrspiegel stehenden Kind. Es sollen demnach aus dem Zerrbild Rückschlüsse auf das Aussehen des Kindes getroffen werden, und die digitalen Daten liefern einen wertvollen Zusatzbeitrag zu konventionellen Datensätzen, um diese Aufgabe zu erfüllen. Er stellt drei wichtige Aspekte der Forschung in seinem Überblicksvortrag vor: Zum einen die Verwendung digitaler Spurendaten für die Messung demografischer Parameter wie Migration, Fertilität oder Mortalität, des Weiteren Instrumente zur Datenerhebung sowie die Messung des Brain Drain und des globalen Wettbewerbs um Talente.

Digitale Daten können demnach genutzt werden, um die Folgen von unvorhergesehenen Ereignissen zu studieren. Mithilfe von Facebook-Daten war es möglich, offizielle Erhebungen zu komplementieren und die Migration nach dem Hurricane Maria in Puerto Rico darzustellen. Man sieht in den Daten eine Erhöhung der Migration in die USA, vorrangig nach Florida und Connecticut im Jahr 2017 sowie die Rückwanderung im Folgezeitraum. Mit Hilfe dieser Daten ist es auch möglich, Modelle zu entwickeln und so das Nowcasting von Migration zu verbessern. Ein weiteres Anwendungsbeispiel ist die Vorhersage des durchschnittlichen gebärfähigen Alters bei Männern mit Hilfe von Facebook-Daten und ausgeklügelten statistischen Methoden. Auch der Zusammenhang der Mobilität und Mortalität in der COVID19-Pandemie kann sehr gut untersucht werden. In einem Modell wurde für die Stadt London eine kontrafaktische Analyse durchgeführt, die zeigt, wieviel Übersterblichkeit durch die Lockdown-Maßnahmen zu Beginn des Jahres 2020 vermieden werden konnte. Für den Zeitraum April bis August 2020 konnten so über 20.000 Tote allein in London verhindert werden.

Ein wichtiges Instrument zur Datenerhebung sind Facebook-Surveys. Emilio Zagheni stellt eine eigene Facebook-Umfrage vor, die Nutzer nach ihrem Gesundheitsverhalten befragt. Hier werden sozio-demografische Faktoren, Gesundheitsindikatoren, Verhalten und Einstellungen, aber auch die Anzahl der Kontakte zu Beginn der Corona-Krise abgefragt. Für acht Länder (Belgien, Deutschland. Spanien, Frankreich, Italien, die Niederlande, Großbritannien und die USA) ergibt sich ein großer Datensatz mit detaillierten Informationen über die Einstellungen und Handlungen der Nutzer. Diese erhobenen Daten sind auch sehr aufschlussreich im Hinblick auf die Merkmale der Nutzer. Auf diesem Wege kann evaluiert werden, ob die Facebook-Daten die richtigen Merkmale hinsichtlich Alter, Geschlecht oder Region ausgeben. In allen drei Kategorien sind diese tatsächlich sehr verlässlich, mit einer Quote zum Teil deutlich über 90 Prozent korrekter Werte.

Als drittes Anwendungsbeispiel für digitale Daten in der Forschung präsentiert Emilio Zagheni eine Studie, die den internationalen Brain Drain illustriert. Anhand der Scopus-Datenbank wurden für den Zeitraum 1996 bis 2020 über 77 Millionen Artikel, 16 Millionen Autoren und über 70.000 Affiliierungen von Autoren ausgewertet. Am Beispiel der hypothetischen Wissenschaftlerin Maria wird gezeigt, wie ein Migrationsevent in die Datenbank eingetragen wird. So erfolgt die Bestimmung des Herkunftslandes der Wissenschaftlerin durch Untersuchung der ersten Affiliierung des ersten wissenschaftlichen Beitrags. Sofern sich diese später ändert, wird von einer Wanderung in ein anderes Land ausgegangen. Einige Länder verzeichnen relativ stabile Wanderungsbewegungen, wie Deutschland oder Frankreich. Andere erfahren starke Abwanderung, wie zum Beispiel Spanien zwischen 2010 und 2015. Generell kann festgestellt werden, dass Brain Drain und die Entwicklung der sozio-ökonomischen Lage (gemessen als GDP per capita) im Land stark zusammenhängen. Professor Zagheni schließt mit dem Hinweis, dass wir in sehr spannenden Zeiten leben und Wissenschaft noch mehr dieser digitalen Schätze heben sollte.