Unsere Spuren im Netz

In sozialen Netzwerken hinterlassen wir ständig Daten. Sie sind auch für die psychologische Forschung eine Fundgrube.

©

Auf den Servern der Welt sammeln sich heutzutage riesige Datenmengen aus fast allen Lebensbereichen an. Wir verwenden Smartphones, posten auf Facebook, kaufen im Internet, erledigen so vieles online, dass jeder von uns mehr oder weniger große digitale Fußabdrücke hinterlässt. Diese Massendaten – Big Data – gelten bei manchen als das Öl des 21. Jahrhunderts, weil sie potenziell ähnlich wertvoll sind. „Big Data von Internetsuchen und anderen Onlineäußerungen bieten einen nie dagewesenen Einblick in die Psyche…

Sie wollen den ganzen Artikel downloaden? Mit der PH+-Flatrate haben Sie unbegrenzten Zugriff auf über 2.000 Artikel. Jetzt bestellen

dagewesenen Einblick in die Psyche der Menschen in einer Form, die sich leicht sammeln und analysieren lässt“, schreibt der renommierte Experimentalpsychologe Steven Pinker von der Harvard University. Auch der Sozialpsychologe James Pennebaker spricht voller Begeisterung von den Möglichkeiten, die Big Data eröffnen: „Indem wir verschiedene Arten von Social Media analysieren, Suchbegriffe oder sogar Blogposts, können wir Denken, Kommunikationsmuster, Gesundheit, Glaubenssätze, Vorurteile, Gruppenverhalten von Menschen erfassen – im Grunde alles, was jemals in der Sozial- und Persönlichkeitspsychologie untersucht worden ist.“

Längst haben Wissenschaftler damit begonnen, die Datenmengen zu nutzen, um mehr über unser Denken, Fühlen und Handeln zu erfahren. Einer von ihnen ist Seth Stephens-Davidowitz. Er hat an der Harvard University in Wirtschaftswissenschaften promoviert und einige Zeit bei Google als Datenexperte gearbeitet. Der Wissenschaftler versucht nicht, mithilfe von Daten etwas über einzelne Personen herauszufinden oder über sie vorhersagen zu können, etwa ihre Persönlichkeit oder ihr Kaufverhalten. Auch sucht er nicht nach Wegen, wie man Menschen beeinflussen kann. Was er für seine Forschung auswertet, sind große Mengen anonymer Daten. Viele stammen von Google Trends (siehe Kasten). Dort lässt sich herausfinden, wann wo wie häufig nach bestimmten Begriffen gesucht wurde. Und in diesem Suchverhalten entdeckt der junge Amerikaner Muster, die Rückschlüsse auf die menschliche Natur erlauben.

Datenschatztruhe Google

Was sich Stephens-Davidowitz dabei offenbart hat, sind beispielsweise Vorurteile, die den Menschen vielleicht gar nicht bewusst sind oder die sie lieber für sich behalten wollen. Er fand zum Beispiel heraus, dass Eltern ihren Töchtern offenbar weniger zutrauen als ihren Söhnen. Die Frage „Ist mein Sohn begabt?“ wird Google 2,5-mal so häufig gestellt wie „Ist meine Tochter begabt?“. Und das obwohl Mädchen in amerikanischen Schulen etwas häufiger an Programmen für Begabte teilnehmen als Jungen. Sind Eltern in manchen Teilen der USA in dieser Hinsicht altmodischer als in anderen? Das verneint Stephens-Davidowitz: „Ich fand keine signifikante Beziehung zwischen diesen Voreingenommenheiten und der politischen oder kulturellen Ausrichtung eines Staats.“

Ausführlich beschäftigte er sich auch mit einer Form des Rassismus, die speziell in den USA ein großes Problem ist: Er untersuchte die Verwendung des Wortes „Nigger“ in Google-Suchen in den verschiedenen amerikanischen Bundesstaaten. Insgesamt gaben Menschen „Nigger“ etwa ebenso häufig in das Suchfeld ein wie „Migräne“ oder „Lakers“ (die Basketball-Mannschaft von Los Angeles). Prozentual besonders betroffen waren der Bundesstaat West Virginia, der Westen von Pennsylvania, der Osten von Ohio, New York (außer New York City und Long Island) und das südliche Mississippi. Betrachtete man die gesamten Vereinigten Staaten, dann zeigte sich, dass die Vorstellung, die viele von der Verbreitung des Rassismus haben, falsch ist. Die wahre Trennlinie, so Stephens-Davidowitz, verlief nicht zwischen Norden und Süden, sondern zwischen Osten und Westen.

Unterschwelligem Rassismus auf der Spur

Häufig erklären Experten die Diskriminierung schwarzer Amerikaner mit unbewussten Vorurteilen. Für Stephens-Davidowitz offenbaren seine Ergebnisse jedoch einen weiteren Grund: „versteckten bewussten Rassismus“, zumindest in Teilen der Bevölkerung. Warum empfinden die Menschen so? Eine Ursache konnte er ausschließen: Finanzielle Not und Arbeitslosigkeit machen Menschen nicht zu Rassisten. Er verglich Regionen, die 2008 stark oder nur wenig von der Wirtschaftskrise betroffen waren, und zeigte dadurch, dass die unterschiedliche wirtschaftliche Lage sich weder auf die Google-Suchen auswirkte noch auf die Mitgliederzahl der Neonazi-Website Stormfront.

Der Datenexperte konnte auch beobachten, welche Wirkung eine Rede von Barack Obama vier Tage nach einem Terroranschlag in San Bernardino hatte, für die der damalige Präsident allgemein wegen seiner versöhnlichen Worte gelobt wurde. Tatsächlich verdoppelten sich aber Suchen, in denen das Wort „Muslim“ mit Begriffen „gewalttätig“ und „böse“ kombiniert wurde, während solche danach, wie man syrischen Flüchtlingen helfen könne, um ein Drittel abnahmen. Doch dann sagte Obama diesen Satz: „Muslimische Amerikaner sind unsere Freunde und Nachbarn, unsere Kollegen, unsere Sportidole und, ja, sie sind unsere Männer und Frauen in Uniform, die bereit sind zu sterben in Verteidigung unseres Landes.“ Daraufhin war zum ersten Mal in mehr als einem Jahr das zweite Substantiv im Zusammenhang mit Muslim nicht Terroristen, Extremisten oder Flüchtlinge, sondern Sportler, gefolgt von Soldaten. „Wenn wir wütende Menschen belehren“, so deutet Stephens-Davidowitz seine Auswertungen, „kann ihr Zorn noch wachsen. Aber subtil ihre Neugier zu reizen, ihnen neue Informationen zu geben und neue Bilder über die Gruppe anzubieten, die ihre Wut entfacht, das könnte ihre Gedanken in andere, positivere Richtungen lenken.“

Was User umtreibt

Stephens-Davidowitz beschäftigt sich auch mit erfreulicheren Themen, etwa der Rolle, die das Lachen in unserem Leben spielt. Mark Twain glaubte: „Der geheime Quell von Humor selbst ist nicht Freude, sondern Leid. Im Himmel gibt es keinen Humor.“ Tatsächlich suchen Menschen im Internet jedoch in guten Zeiten eher nach Witzen als in schlechten. Nach dem Anschlag auf den Marathon in Boston fielen Suchen nach Witzen um 20 Prozent. Gesucht wird nach Lustigem dabei am häufigsten von Frei-tag bis Sonntag, am seltensten montags. Das liegt nicht daran, dass die Menschen an Montagen keine Zeit zum Suchen haben. Denn Fragen nach „Depressionen“ oder „Arzt“ häufen sich am ersten Tag der Woche.

Eine andere Auswertung zeigte, was Menschen um drei Uhr nachts besonders häufig googeln, was sie also um den Schlaf bringt: finanzielle Probleme und solche juristischer Art sowie Sorgen um die Gesundheit. Was die User umtreibt, ist die Angst um ihr eigenes Wohlbefinden. Entsprechend sind häufige Kombinationen bei allen Suchen nach Angst (Angst vorm Autofahren, Reiseangst, Trennungsangst, Angst jeweils bei der Arbeit, in der Schule, zu Hause). Der Anteil solcher Anfragen hat sich von 2008 bis 2016 mehr als verdoppelt. Dagegen lösten Terroranschläge keine verstärkten Suchen zu diesem Stichwort aus.

Während der Wirtschaftskrise von 2008 schnellten parallel zur Arbeitslosigkeit Suchen wie „Vater/Mutter schlägt mich“ in die Höhe, für den Datenspezialisten ein Indikator für die Zunahme von Kindesmisshandlungen. Er glaubt, dass solche Analysen helfen können, gefährdete Gruppen zu finden, die sonst vielleicht übersehen würden. „Google-Suchen offenbaren eine versteckte Welt, die sich stark von der unterscheidet, die wir zu sehen glauben.“

Im Hinblick auf das, was sie mithilfe von Big Data untersuchen, sind Wissenschaftler ziemlich erfinderisch. Anhand von Listen von Nachnamen und mit entsprechenden Auswertungsmethoden zeigten italienische Forscher, dass an den dortigen Universitäten Vetternwirtschaft herrschte, sprich: Professoren stellten mit Vorliebe Verwandte ein. Nach 2010, als ein Gesetz dagegen in Kraft trat, nahm diese Tendenz ab. Seth Stephens-Davidowitz fand ein ähnliches Phänomen in der amerikanischen Politik. Söhne von Präsidenten, Gouverneuren und Senatoren erreichten öfter dieselbe Position als Durchschnittsamerikaner und auch häufiger, als es sich durch die Vererbung einer Begabung erklären ließe. Denn bei Basketball-, Football- und Baseballspielern kam es deutlich seltener vor, dass Söhne ebenso erfolgreich waren wie ihre Väter.

Gefährdete Privatsphäre

Nicht nur bei der Verwendung von Suchmaschinen hinterlassen wir Spuren im Internet, sondern auch in den sozialen Medien wie Facebook, Twitter und Instagram.

Moira Burke, die zum Thema Mensch-Computer-Interaktionen an der Carnegie Mellon University promoviert hat, und zwei ihrer Kolleginnen arbeiten bei Facebook selbst. Sie betrachteten 400 000 Posts und Kommentare aller amerikanischen Nutzer, die wenigstens einmal pro Monat auf Facebook aktiv waren und mindestens einen anderen Nutzer als Elternteil oder Kind gekennzeichnet hatten. Wenn sie das Elternhaus verlassen, um aufs College zu gehen, ziehen Töchter und Söhne im Durchschnitt gleich weit weg. Und von da an vergrößert sich die Entfernung. Allerdings leben Frauen über 30 in größerer Nähe zu ihren Müttern und Vätern als Männer. Im Gegensatz zu früheren Studien, die ergaben, dass der Kontakt mit wachsender Entfernung abnahm, blieb die Kommunikation zwischen den Generationen mittels Facebook konstant, und zwar unabhängig von Alter und Geschlecht. Mit Kindern im Teenageralter sprechen Väter und Mütter auf dieser Plattform in unterstützender, lobender Weise, mit ihren erwachsenen Kindern dagegen wie mit Gleichaltrigen, etwa über Gesundheitsprobleme oder andere Familienmitglieder. Eine Ausnahme gibt es: Flüche und Begriffe, die mit Alkohol und Sex zusammenhängen, bleiben weitgehend der Kommunikation mit Freunden vorbehalten, und die jüngere Generation hält es genauso.

Eine weitere Studie, an der Moira Burke beteiligt war, sichtete die Daten von 12 Millionen Facebook-Nutzern sowie Totenscheine des California Department of Public Health, um herauszufinden, welchen Einfluss Kontakte in den sozialen Medien auf die Lebenserwartung haben. Zwei der Ergebnisse: Freundschaftsanfragen von anderen zu erhalten wirkt sich positiv aus, sie selbst zu stellen hat dagegen keinen Einfluss. Das geringste Sterberisiko hatten Menschen mit vielen sozialen Kontakten im wirklichen Leben (abgeleitet aus geposteten Fotos, die die Betreffenden mit anderen zeigten,) und einer mäßigen Aktivität bei Facebook.

Finanzdaten aller Einwohner

Die angelsächsische Welt ist bei der Nutzung von Big Data für die psychologische Forschung offenbar Vorreiter. Doch in Heft 3/2017 der Zeitschrift der Deutschen Forschungsgemeinschaft (DFG) finden sich gleich zwei Studien, bei denen die Wissenschaftler große Datenmengen auswerten möchten: Die eine Gruppe plant, die Bewegung von Arbeitskräften zwischen Deutschland und Österreich mithilfe von Daten der Sozialversicherungen zu untersuchen. Eine andere Gruppe beschäftigt sich mit der These, dass Unternehmen Frauen in erster Linie in Krisenzeiten auf Toppositionen befördern. Dafür nutzten sie unter anderem Zahlen der 110 größten deutschen Firmen im DAX, MDAX und TecDAX.

Eine besonders umfangreiche Datenmenge stand einer Gruppe von Forschern um Shaojun Luo vom City College of New York zur Verfügung: Telekommunikations- und Bankdaten der gesamten mexikanischen Bevölkerung. Sie wollten herausfinden, ob die Art der sozialen Kontakte die finanziellen Verhältnisse einer Person beeinflusst, wie theoretische Analysen vermuten lassen. Das Ergebnis: Die Reichsten ein Prozent zeichnen sich den Ärmsten zehn Prozent gegenüber durch „aktivere und vielfältigere Verbindungen“ aus, häufigere Kontakte zu weit entfernten Orten und dadurch, dass sie mit anderen ebenfalls wohlhabenden Personen telefonieren. Allerdings lässt sich aus den Ergebnissen nicht ableiten, was Ursache ist und was Wirkung. Sprich: Haben die Reichen mehr Geld, weil sie über diese besonderen Arten von Kontakten verfügen? Oder können sie sich mehr Ferngespräche leisten und kennen mehr Reiche, mit denen sie kommunizieren können? Bemerkenswerter ist etwas anderes. Die Autoren stellen fest, dass sich die Daten eines einzelnen Landes nicht verallgemeinern lassen. Um das tun zu können, benötigten sie die Kommunikations- und Finanzdaten aller Einwohner verschiedener Staaten. Spätestens hier drängt sich die Frage auf: Ist es wirklich eine gute Idee, sensible Daten in einem solchen Umfang in die Hände einiger Universitätswissenschaftler zu geben – und seien diese noch so ehrenwert? Was, wenn sie in unbefugte Hände gelangen?

Die Daten aus Google-Suchen enthalten keinerlei Hinweise auf einzelne Personen. Für die Forschung von Seth Stephens-Davidowitz ist das auch nicht nötig, denn er möchte nur allgemeine Tendenzen, Entwicklungen und Zusammenhänge aufdecken. Im Fall von Luo umfassten die Bankdaten aber zum Beispiel die Telefonnummern der Betreffenden, was eine Zuordnung zu ihrem Telefonverhalten erst ermöglichte und deshalb eine Anonymisierung vor der Verarbeitung ausschloss. „Massendaten bieten die Möglichkeit, massenhaft in die Privatsphäre von Bürgern einzubrechen“, warnte schon 2015 eine Ankündigung für ein Symposium mit dem Titel „Big Data, Big Hype, Big Brother“ in Mainz.

Wofür sind all die Daten gut?

Nassim Taleb von der Tandon School of Engineering an der New York University hat sich mit der Aussagekraft großer Datenmengen beschäftigt. Sie eignen sich gut, so sagt er, um zu zeigen, welche Zusammenhänge nicht bestehen, also um Theorien zu widerlegen: wenn zum Beispiel Stephens-Davidowitz demonstriert, dass eine Wirtschaftskrise nicht die Tendenz zu Rassismus erhöht oder dass einige unserer Vorstellungen über Humor oder Ängste nicht zutreffen. Sie eignen sich aber nicht, so Taleb, um Zusammenhänge zu beweisen.

Experten wissen, dass, wenn man nur genug Dinge testet, irgendein Ergebnis rein zufällig statistisch signifikant sein wird. Um das zu illustrieren, nennt Stephens-Davidowitz in seinem Buch das folgende Beispiel: Forscher, die Twitter an sieben aufeinanderfolgenden Tagen auf eine ganze Reihe von Gefühlsäußerungen hin untersuchten, wurden bei einer der vielen Kombinationen fündig: Der Dow-Jones-Aktienindex stieg mit großer Wahrscheinlichkeit sechs Tage, nachdem besonders viele Menschen eine gelassene Stimmung zu erkennen gaben. Wertpapierkäufe und -verkäufe danach auszurichten ist aber sicher keine gute Idee. Denn: Wenn man nur lange genug ausreichend viele Daten durchsucht, findet man immer irgendwelche scheinbaren Zusammenhänge. Um zu beweisen, dass das eine das andere verursacht, ist weitere Forschung nötig. PH

Big Data auf chinesisch

Die Datenmengen, die wir alle im Internet hinterlassen, werden nicht nur von verantwortungsvollen Wissenschaftlern ausgewertet. Das Beispiel China zeigt, wie gefährdet die Privatsphäre und die Demokratie sind, wenn Internetdaten in die Hände von totalitären Regimen geraten.

Um seine Bürger besser kontrollieren zu können, hat Chinas Regierung das sogenannte Sozialkreditsystem eingeführt. Grundlage sind alle Daten, die ein Bürger im Netz hinterlässt. Ob er eine rote Ampel übersieht und dafür Strafpunkte kassiert, ob er eine kritische politische Meinung auf Facebook postet, ob er einen Kredit aufnimmt, alles wird auf einem Punktekonto gesammelt und nach einem abgestuften System A bis D bewertet. Wer sich im Sinne der Regierung einwandfrei verhält, wird Klasse A zugeordnet und bevorzugt behandelt, beispielsweise bei der Zuweisung von Sozialleistungen. Wer dagegen in der untersten Klasse D landet, bekommt Leistungen gestrichen, kann keinen Kredit aufnehmen und darf keine Führungsposition einnehmen.

Vorgebliches Ziel der chinesischen Regierung sei der moralisch einwandfreie Bürger, schreibt Chinakorrespondent Axel Dorloff. In Wirklichkeit wolle sie die Menschen noch effektiver der sozialen Kontrolle unterwerfen, als ohnehin schon. „Kein anderes Land treibt es so radikal voran, seine Bürger im digitalen Zeitalter zu kontrollieren.“

OnlineTrends selbst erforschen

Wer neugierig geworden ist und zum Beispiel wissen möchte, wie manches sich in Deutschland verhält, kann auf verschiedenen Websites selbst zum Forscher werden. Hier einige Links

1. Google Trends, das Werkzeug, das Seth Stephens-Davidowitz häufig verwendet hat: trends.google.de und google.com/trends/correlat

2. Englischsprachige Instrumente, um Online­trends zu beobachten: truthy.indiana.edu/tools/

3. Das Hedonometer von Peter Dodds und seinen Kollegen zeigt an, wie viele Äußerungen von (Un)Glück sich für bestimmte Tage auf Twitter finden lassen: hedonometer.org

4. Man kann auch einfach einen Satzanfang in das Suchfeld von Google eingeben. Die Selbstvervollständigung zeigt dann jeweils die häufigsten Anfragen. Beispiele:

Ist mein Sohn/meine Tochter/mein Mann/meine Frau …

Warum sind Türken, Schwule, Lehrer …

So lässt sich erkennen, was eine größere Zahl der Suchenden umtreibt und welche Vorurteile möglicherweise verbreitet sind.

Illustration zeigt einen Mann am Laptop, der eine Datenwolke hinterlässt
Jeder von uns hinterlässt eine ständig wachsende Wolke persönlicher Daten.

Dieser Artikel befindet sich in der Ausgabe: Psychologie Heute 2/2018: Die Stärke der Stillen