Problembeschreibung: Durch Vorurteile verfälschte wissenschaftliche Studien
In der Zeitschrift "Observer" der Association for Psychological Science (APS) stellte Prof. Gernsbacher dar, wie Vorurteile in der Forschung identifiziert werden können. Dazu wurden drei Beispiele (darunter das einer "Studie" an Autisten) von Studien vorgegeben, die hier "relativ trocken" wiedergegeben werden.
Erste Studie aus dem Jahr 1924:
Bedeutungslose Bilder wurden hergestellt, indem Tusche in unterschiedlicher Intensität auf geweißtes Papier gegeben und Druck durch eine aufgelegte Glasplatte ausgesetzt. Zwei genetisch unterschiedliche Gruppen von 25 menschlichen Teilnehmern wurden diese bedeutungslosen Bilder gezeigt und für zwei Minuten aufgefordert über jedes Objekt im Bild zu berichten, das sie wiedererkannten. Eine Gruppe der Teilnehmer war eher geneigt auszusprechen, was der Versuchsleiter als "nichtssagende" Äußerungen erachtete, wie "Ich sehe wirklich keine Objekte" oder, wie im Fall eines Teilnehmers "Wenn Sie ein Fotograf wären, Doktor, würde ich Ihnen gerne mitteilen, dass Sie Ihren Beruf wechseln sollten." Die andere Gruppe sprach eher über Objekte wie Hunde, Elefanten und Dampfschiffe. Da die erste Gruppe ein größeres Verhältnis von "nichtssagenden" gegenüber "bedeutungsvollen" Mitteilungen hatte, wurden sie außerdem als "geschwätzig" eingestuft.
Originalzitat:
Two genetically distinct groups of 25 human participants were shown the meaningless picture and asked to talk, for two minutes, about any objects in the picture that they recognized. One group of participants was more prone to articulate what the researcher deemed “insignificant” statements, such as “I really don’t see any objects” or, in the case of one participant, “If you are a photographer, doctor, I’d like to tell you that you had better change professions.” The other group was more likely to talk about objects such as dogs, elephants, and steamships. Because the first group had a higher ratio of “insignificant” to “significant” statements, that group was also deemed “talkative.”
Zweite Studie aus dem Jahr 2005:
Eine Zielkraft wurde der Versuchsperson am linken Zeigefinger durch einen Drehmotor zugefügt. Die Versuchspersonen wurden danach aufgefordert, den gerade erfahrenen Druck zu reproduzieren, indem sie entweder direkt mit dem Zeigefinger der rechten Hand drückten oder indirekt, indem sie einen Joystick nutzten, um den Drehmotor zu kontrollieren.
Beide Gruppen erzielten größere Übereinstimmungen zum ursprünglichen Druck, wenn sie den Joystick nutzen anstatt ihren Zeigefinger. Außerdem zeigten beide Gruppen keine Unterschiede, wenn sie den Joystick nutzten. Die (in einem Diagramm der Originalquelle) blau dargestellte Gruppe erzielte mit dem Zeigefinger eine deutlich bessere Genauigkeit als die rot dargestellte Gruppe, diese Genauigkeit wurde als "perfekte Ausführung" bezeichnet.
Die Resultate wurden von den Forschern als Bestätigung der Hypothese gedeutet, dass eine Gruppe charakterisiert war von "einer Dysfunktion in ihrer Fähigkeit, sensorische Konsequenzen ihrer Aktionen vorherzusehen." Tatsächlich lautete der Artikel "Anzeichen für sensorische Vorhersehbarkeitsdefizite" für diese Gruppe der Teilnehmer. Für welche Gruppe?
Die blaue Gruppe.
Originalzitat:
The data from the study’s two groups of 20 participants are shown in Figure 1. Both groups “reproduced the original force much more accurately” when using the joystick to control the torque motor than when using only their index finger. And when using the joystick, the two groups did not differ. In contrast, when using their index fingers to control the torque motor, the group represented in blue was significantly “more accurate at the task;” that group’s ability to match the target force more closely resembled “perfect performance.”
These results were interpreted by the researchers as supporting the hypothesis that one group was characterized by “a dysfunction in their ability to predict the sensory consequences of their actions.” Indeed, the title of the article was “Evidence for Sensory Prediction Deficits” among this group of participants. Which group? The blue group.
Dritte Studie:
Verwendet wurde das Deese-Roediger-McDermott "Falsche Gedächtnis" Paradigma.
Zwei Gruppen von Teilnehmern wurden akustische Aufzählungen von semantisch ähnlichen Wörtern vorgestellt (z.B. Bett, ausruhen, aufwachen, müde und träumen). Später wurden sie gebeten zwischen gehörten und nicht gehörten Wörtern zu unterscheiden, die semantisch mit den Worten assoziiert waren, die sie gehört hatten (z.B. schlafen).
Die grüne Gruppe zeigte eine deutlich bessere Gedächtnisunterscheidung als die lila Gruppe; die grüne Gruppe "erkannte" weniger nicht gehörte Worte als vermeintlich gehört. Das bessere Ergebnis dieser Gruppe wurde ihrer kognitiven Darstellung von Wörtern "in einer ungewöhnlichen Weise" zugeschrieben, obwohl bei einem direkten Test von semantischer Clusterbildung keine Unterschiede in beiden Gruppen bestanden. Die ungewöhnliche semantisch-kognitive Darstellung der grünen Gruppe wurde mit der Hypothese belegt, dass dies von "anatomischen Abnormaltitäten ... oder einer bislang unbekannten Krankheit" herrühre.
Als ein anderes Forscherteam keine Unterschiede zwischen Grün und Rot zugeordneten Teilnehmern berichtete, interpretierten die Autoren der Studie, welche die bessere Unterscheidung der grünen Gruppe beobachtet hatte, das Fehlen der Unterscheidung zwischen den Gruppen für die grüne Gruppe so, dass sie außerdem eine "frontal-ausführende Beeinträchtigung" aufweise.
Originalzitat:
As shown in Figure 2, the green group demonstrated significantly better memory discrimination than the purple group; the green group was less likely to falsely recognize words they hadn’t heard, despite the false words’ semantic association with words they’d heard.
The green group’s better memory discrimination was attributed to their mentally representing words “in an aberrant manner,” even though a concurrent — and direct — test of semantic clustering found no differences between the green and purple groups. The green group’s aberrant semantic mental representations was hypothesized to stem from “anatomic abnormalities … or as a result of an as-yet unknown pathology.”
When another research team reported no difference between green- and purple-type participants in either false recall or false recognition, the authors of the study that had observed the green group’s better discrimination interpreted the other study’s lack of a between-group difference to the green group also having “frontal-executive impairment.”
Fazit:
Verwirrt? Was wäre, wenn die Gruppe, die mit "nichtssagenden" Mitteilungen und "geschwätzig" beschrieben wurde, ganz "normale Frauen", die Gruppe, die angeblich sensorische Konsequenzen für ihre Handlungen nicht vorhersehen könne mit Schizophrenie und die Gruppe mit besseren Gedächtnisleistungen als autistisch diagnostiziert wären? Würde das die Ergebnisse akzeptabler machen? Das sollte es nicht.
Um Verfälschungen von Studienergebnissen durch Vorurteile identifizieren zu können, sollten als neues Kriterium korrekter Studiendurchführung nach dem Zufallsprinzip die Bezeichnungen ausgetauscht werden.
Quelle