Wie finden Sie das? Jede Woche kauft ein Mann ein totes Huhn, doch bevor er es isst, hat er damit Sex. Oder: Zwei Geschwister, Bruder und Schwester, suchen sich regelmäßig ein Versteck, in dem sie sich leidenschaftlich küssen. Eine Frau zerreißt die Nationalflagge ihres Landes und putzt damit ihre Toilette. Welche Aktivitäten finden Sie inakzeptabel, welche sollten verboten werden?
Der amerikanische Psychologe Jonathan Haidt, heute an der New York University, präsentierte diese Szenen 1993 Versuchspersonen…
Sie wollen den ganzen Artikel downloaden? Mit der PH+-Flatrate haben Sie unbegrenzten Zugriff auf über 2.000 Artikel. Jetzt bestellen
präsentierte diese Szenen 1993 Versuchspersonen aus Philadelphia und den brasilianischen Städten Recife und Porto Alegre. Haidt wollte herausfinden, ob Moralvorstellungen angeboren oder kulturell bedingt sind. Er ging davon aus, dass er von Menschen aus den USA und Brasilien unterschiedliche Antworten erhalten würde. Aber Haidt wurde überrascht. Die größten Unterschiede gab es innerhalb der Städte. Eine Flagge als Putzlappen? Das fanden mehr als die Hälfte der Menschen mit geringem sozioökonomischem Status fragwürdig. Über Ländergrenzen hinweg hatten jedoch drei Viertel der Probanden mit höherem Status damit keine Probleme.
Mit seinen Experimenten und Arbeiten umreißt Haidt ein grundsätzliches Problem der Psychologie: Viele Forschenden neigen dazu, soziale Unterschiede bei Experimenten zu ignorieren. Wenn Psychologinnen und Psychologen von „signifikanten Unterschieden“ in einem Experiment sprechen, beziehen sie sich oft nur auf Studierende ihrer Universität. Psychologen greifen für ihre Untersuchungen gerne auf angehende Akademikerinnen und Akademiker am eigenen Institut zurück – die sind leicht erreichbar und kosten nichts.
Joe Henrich: Typische Versuchspersonen sind „weird“
Joe Henrich von der University of British Columbia prägte für solche typischen Probanden den Begriff weird. Das ist das englische Wort für seltsam, verschroben. Henrich meint es aber gleichzeitig als Akronym für western, educated, industrialized, rich and democratic. Die Forschung beruht demnach auf wohlhabenden, gebildeten Personen, die in westlichen Industriestaaten leben. Das bestätigt eine Auswertung von führenden Fachzeitschriften: In den von 2003 bis 2007 veröffentlichten Studien kamen 96 Prozent der Versuchspersonen aus Industrieländern, überwiegend aus Nordamerika, Europa, Australien und Israel. Nicht nur das: 67 Prozent der amerikanischen Probandinnen und Probanden studierten selbst Psychologie.
In Deutschland ist das nicht anders. Markus Bühner verweist darauf, dass nur Abiturienten mit guten Noten für ein Psychologiestudium zugelassen werden. Untersuchungen, bei denen beispielsweise Intelligenz ein Teil der Fragestellung ist, seien mit solchen Probanden nicht repräsentativ, sagt der Professor für psychologische Methodenlehre und Diagnostik an der Ludwig-Maximilians-Universität München.
Das wäre hinnehmbar, würden Psychologinnen und Psychologen nicht häufig aus ihren Untersuchungen Rückschlüsse auf den Menschen als solchen ziehen. Ein deutscher Psychologe, der nicht genannt werden möchte, erklärt, auf das weird-Problem angesprochen: Viele menschliche Verhaltensweisen seien so grundlegend, so genuin, dass Rückschlüsse von Studierenden auf die Allgemeinheit durchaus zulässig seien. Samuel D. Gosling, Psychologe an der University of Texas, sieht das anders: „Wir können auch von Fruchtfliegen auf die menschliche Psychologie schließen – das ist aber nicht meine Vorstellung von unserem Fach.“
Das Problem ist schon lange bekannt. Bereits in den 1960er Jahren forderten Forschende ihre Kollegen auf, ihre Versuchspraxis zu verbessern. Gosling hat aktuelle und ältere Fachveröffentlichungen miteinander verglichen. Sein Fazit: „Es hat sich wenig geändert.“
Soziale und kulturelle Unterschiede wenig berücksichtigt
In welcher Kultur ein Mensch lebt, ob er arm oder reich ist, welchen Bildungsstand er hat, das kann selbst grundlegende psychologische Prozesse beeinflussen. Das zeigen zum Beispiel Untersuchungen zur Wahrnehmung optischer Täuschungen, etwa der sogenannten Müller-Lyer-Illusion. Dabei sollen Versuchspersonen zwei gerade Linien betrachten und schätzen, welche die längere ist. Die eine Linie endet auf beiden Seiten mit je einer Pfeilspitze, bei der anderen Linie sind die Pfeilspitzen umgedreht und zeigen nach innen. Beide Linien sind exakt gleich lang, aber die meisten Menschen würden die mit den umgedrehten Pfeilen als länger einschätzen. 1966 fand der Psychologe Marshall Segall heraus, dass Probandinnen und Probanden aus dem indigenen Volk der San im südlichen Afrika nicht so leicht dieser Illusion erlagen. Sie schätzten die Linien als weitgehend gleich lang ein. Segall vermutete, dass sie in ihrer natürlichen Umgebung an andere geometrische Relationen gewöhnt sind.
Nicolas Baumard und Dan Sperber finden, dass soziale und kulturelle Unterschiede auch in anderen Bereichen der Psychologie zu wenig berücksichtigt werden, oft bereits bei der Versuchsanordnung. Die Wissenschaftler von der University of Oxford verweisen auf spieltheoretische Experimente, wie sie in der Forschung populär sind. Mithilfe des Ultimatumspiels etwa wollen Psychologen herausfinden, wie altruistisch oder egoistisch Menschen sind. Dabei erhält Proband A Geld und soll dem Probanden B davon etwas abgeben. Wenn dieser den Anteil akzeptiert, dürfen beide ihr Geld behalten. Lehnt B das Angebot ab, gehen beide leer aus. Baumard und Sperber bemängeln, dass solche Versuchsanordnungen extrem künstlich sind. Je nachdem, in welchem Kulturkreis die Menschen aufgewachsen sind, interpretieren sie die Situation von vornherein unterschiedlich.
Spielteilnehmende aus demokratischen kapitalistischen Staaten sehen den anderen Probanden als anonymen Mitspieler an, dem sie keinerlei Verpflichtungen gegenüber empfinden, während Stammesangehörige sich möglicherweise verpflichtet fühlen, dem anderen etwas abzugeben. Solche Experimente sagen deshalb nichts über grundlegende menschliche Moralvorstellungen oder gar anthropologische Konstanten aus.
Weird-Problematik gibt es auch in der Neurowissenschaft
Auch Neurowissenschaftler sind vor dem weird-Problem nicht gefeit. In der Hirnforschung liegt der Anteil der weird-Probanden bei etwa 90 Prozent. Wichtige Erkenntnisse über das menschliche Gehirn und Nervensystem gründen zudem auf Tiermodellen oder Fallstudien von gehirngeschädigten Patienten. Das sind Bereiche, in denen sich nicht unbedingt die menschliche Vielfalt abbildet. Hinzu kommt, dass in vielen nichtwestlichen Ländern teure Technologien für Experimente überhaupt nicht zur Verfügung stehen.
Ein Beispiel ist die funktionelle Magnetresonanztomografie, ein bildgebendes Verfahren, mit dem die Forschenden bei ihren Experimenten die aktiven Hirnareale in hoher Auflösung auf einem Computerbildschirm darstellen können. Das gegenwärtige Wissen über die Funktionen der Gehirnareale basiert daher weitgehend auf Beobachtungen an gebildeten wohlhabenden Probandinnen und Probanden aus westlichen Industriestaaten. „Es gibt eine riesige empirische Lücke in unserem Verständnis, wie Kulturen Verstand, Gehirn und Verhalten beeinflussen“, schreiben Joan Chiao und Bobby Cheon von der Northwestern University in Illinois in ihrem Aufsatz The weirdest brains in the world, ihrem Beitrag zur weird-Debatte.
„Globalisierung der amerikanischen Psyche“
Hirnforschung, spieltheoretische Ansätze: Handelt es sich beim weird-Problem ausschließlich um ein Problem der Grundlagenforschung? Wahrscheinlich nicht. Samuel Gosling etwa fürchtet, dass es auch bei der Behandlung psychischer Störungen eine Rolle spielt. „Therapeuten sind auf die Gefühlswelt von Bildungsbürgern geschult“, sagt Gosling. „Da sie häufig weirds behandeln, fällt das nicht weiter auf. Ich fürchte aber, dass viele gar nicht wissen, wie die ärmeren Menschen draußen ticken.“ Allerdings ist bislang wenig erforscht, wie sich die weird-Problematik auf die psychologische Praxis auswirkt.
Der Journalist Ethan Watters warnte in seinem 2010 erschienenen Buch Crazy like us vor einer „Globalisierung der amerikanischen Psyche“. 2004 beobachtete er, wie nach der Tsunamikatastrophe im Indischen Ozean westliche Psychologen und Psychiater in das Krisengebiet flogen, um Menschen mit posttraumatischen Belastungsstörungen in Einzeltherapiesitzungen zu behandeln. In Sri Lanka jedoch, so Watters, hatten die Menschen große Angst, durch die Einzeltherapie in ihrer Gemeinschaft stigmatisiert und sozial ausgeschlossen zu werden. Die Behandlungen hätten das Leid der Betroffenen möglicherweise verschlimmert. Psychologen müssten den religiösen und sozialen Kontext anderer Kulturen in die Therapieansätze integrieren – stattdessen leiteten sie ihre Ansätze zu sehr von der westlichen Forschung ab.
Das Internet könnte künftig helfen, eine größere Vielfalt unter den Versuchsteilnehmenden zu erreichen. Anja Göritz, Wirtschaftspsychologin an der Universität Freiburg, hat zum Beispiel das Wiso-Panel aufgebaut. Darin sind Personen registriert, die wiederholt an Onlinestudien teilnehmen möchten. „Im Panel sind rund 11 000 Personen, die in Alter, Geschlecht, Erwerbsstatus, Region, Bildung breit gestreut sind“, sagt Göritz. Nur ein knappes Viertel sind Studierende, 62 Prozent sind Frauen. Der Altersdurchschnitt beträgt 41 Jahre.
Eine noch viel größere Masse an potenziellen Probanden bieten sogenannte Crowdsourcing-Plattformen wie Clickworker, CloudCrowd oder Microtask. Die derzeit populärste ist der Mechanical Turk des Internethändlers Amazon. Crowdsourcing bezeichnet die Auslagerung von kleineren Arbeiten an Internetnutzenden. Das Prinzip ist simpel: Arbeitgeber bieten auf der Website Minijobs an, die sich in etwa 15 Minuten bis mehreren Stunden erledigen lassen. Die Arbeitnehmer bleiben anonym, müssen aber demografische Angaben etwa zum Alter, Geschlecht oder Bildungsstand machen. Erste Untersuchungen zum Mechanical Turk legen nahe, dass Crowdsourcing tatsächlich zu mehr Vielfalt unter den Versuchspersonen führen könnte.
Repräsentativere Stichproben dank Crowdsourcing
Samuel Gosling hat 2011 mit Kollegen die registrierten Turks erforscht. Der Mechanical Turk bietet derzeit mehr als 500 000 potenzielle Probandinnen und Probanden. Gosling ermittelte die demografischen Daten von gut 3000 Turks. Sie kamen aus 50 verschiedenen Ländern und allen 50 US-Bundesstaaten. 55 Prozent waren weiblich, 36 Prozent nicht von weißer Hautfarbe. Im Durchschnitt sind Turks 32,8 Jahre alt – und damit insgesamt deutlich repräsentativer als die durchschnittlichen Versuchspersonen an Hochschulen.
Der Psychologe David Rand von der Universität Harvard behauptet, dass er mithilfe der Mechanical Turks bereits eine Studie zur Moralpsychologie widerlegen konnte. Es geht darin um das sogenannte Trolleyproblem: Man stellt sich vor, eine Straßenbahn gerät außer Kontrolle und rast auf fünf Personen zu. Ein Beobachter steht auf einer Brücke und könnte die Bahn stoppen. Allerdings müsste er dafür einen dicken Mann, der neben ihm steht, vor die Bahn stoßen. Probanden sollen sich vorstellen, wie sie in der Rolle des Beobachters handeln würden. Der Psychologe Daniel Bartels von der Columbia University in New York fand 2008 heraus, dass 90 Prozent der Befragten sich weigern würden, den Mann von der Brücke zu werfen. Bartels hatte die Frage allerdings seinen Studierenden vorgelegt.
David Rand führte eine vergleichbare Studie mit Probanden durch, die er über den Mechanical Turk gewonnen hatte. Er erklärte gegenüber der Zeitschrift The Economist, dass er Bartels’ Zahlen nur bei Atheisten bestätigt fand. Bei religiösen Menschen sei er zu anderen Ergebnissen gekommen. Anscheinend bewerten sie eine Verweigerung der Tat als verantwortungslos. Religiöse Menschen seien jedenfalls unter Turks häufiger anzutreffen als unter Harvard-Studierenden. Rand fordert, auch andere mit weirds durchgeführte Studien auf den Prüfstand zu stellen.
Datenqualität bei Crowdsourcing-Teilnehmern fragwürdig
Ulf-Dietrich Reips, Psychologe an der Universidad de Deusto in Bilbao, mahnt allerdings auch beim Mechanical Turk zur Vorsicht. Der Forscher wollte herausfinden, wie es um die Datenqualität des Mechanical Turk steht. Er lockte Teilnehmerinnen und Teilnehmer über Mailinglisten, Webseiten, Blogankündigungen und Facebook-Gruppen. Einen weiteren Teil rekrutierte er via Mechanical Turk.
Er gewann 1393 Turks und 577 andere Teilnehmende. Beide Gruppen sollten 160 Aussagen zu ihrer Persönlichkeit zwischen zutreffend und nicht zutreffend in mehreren Abstufungen einordnen. Die Turks bearbeiteten die Umfrageseiten mit je acht Aussagen durchschnittlich 5,6 Sekunden schneller als die anderen Teilnehmer. 76,5 Prozent der Turks hielten bis zum Ende durch – gegenüber 57,6 Prozent bei den anderen. Bei den Turks lagen die Antworten tendenziell eher in der Mitte der Abstufungen – was typisch ist für Menschen, die Fragen eher überfliegen, als darüber nachzudenken.
„Turks wollen vermutlich ihren Job erledigen und weniger einen Beitrag zur Wissenschaft leisten“, sagt Reips. „Normalerweise haben Webdaten eine bessere Qualität, weil unmotivierte Teilnehmer im Gegensatz zur Laborbefragung leichter abbrechen können und rausfallen, statt Datenmüll zu produzieren“, so der Forscher. „Turks bekommen ihre Bezahlung aber erst mit Abschluss der Befragung.“ Samuel Gosling fand in einem vergleichbaren Experiment indes keine wesentlichen Unterschiede zwischen Turks und herkömmlichen Onlineerhebungen. Beide Forscher geben aber zu, dass es noch mehr Studien brauche, um die Qualität des Systems zu beurteilen.
Crowdsourcing dürfte auch die Überprüfung von bisherigen Forschungsergebnissen erleichtern. In der Wissenschaft gelten Studienergebnisse als gesichert, wenn sie sich immer wieder in neu aufgelegten Versuchsreihen reproduzieren lassen. Doch Forschende tun sich gewöhnlich schwer damit, Versuche von anderen zu wiederholen. Es bringt wenig Prestige, kostet Zeit und darüber hinaus drucken wissenschaftliche Zeitschriften lieber neue Studien ab. Brian Nosek von der University of Virginia war so frustriert über die Zunahme zweifelhafter Studien in der Psychologie, dass er mit Kollegen das Reproducibility Project lancierte – eine Website, auf der er Wissenschaftler weltweit auffordert, beispielhaft alle Publikationen aus drei psychologischen Fachzeitschriften des Jahres 2008 zu reproduzieren und die Ergebnisse hochzuladen.