Wie aus Daten Anekdoten werden

Buchkritik:

„Everybody Lie“ von Seth Stephens-Davidowitz –

Bücher, Artikel und Vorträge über Big Data gibt es mittlerweile eine ganze Menge. Viele zeigen die Möglichkeiten, damit Geld zu verdienen, andere warnen vor den gesellschaftlichen Gefahren der Überwachung und Verhaltenssteuerung. Und einige demonstrieren, welche mehr oder minder überraschenden Erkenntnisse man aus den Datenmengen des Internets ziehen kann: Dataclysm (deutsch: „Inside Big Data“), von Christian Ridder zeigt, wie sich Vorurteile in dem Klickverhalten auf Dating-Sites offenbaren. „A Billion Wicked Thoughts“ (deutsch: „Klick! Mich! An!“), von  Ogi Ogas und Sai Gaddam, untersucht detailreich unsere sexuellen Vorlieben auf Basis von Klickdaten von einschlägigen Seiten wie Pornhub.

Nun ist ein weiteres Buch in englischer Sprache erschienen, das die gleichen Methoden vorstellt. In „Everybody Lies“ preist Data Scientist Seth Stephens-Davidowitz die Möglichkeiten der Datenanalyse für das Verständnis der menschlichen Seele und unseres Zusammenlebens: „Der nächste Freud wird Data Scientist sein. Der nächste Marx wird Data Scientist sein“, meint der Autor überzeugt. Er selbst war Analyst bei Google und die meisten seiner Untersuchungen basieren auf Millionen von Google-Suchanfragen. Diese Datensätze werden quer gebürstet, um versteckte und verdrängte Einstellungen ans Tageslicht zu fördern.

Denn Stephens-Davidowitz ist wie Dr. House aus der TV-Serie davon überzeugt, dass jeder lügt. Umfrage-Daten gäben deshalb immer nur ein geschöntes Bild unserer Gesellschaft ab. Die Wahrheit zeige sich jedoch jenseits der Befragungen – wenn wir uns anonym und unbeobachtet im Internet bewegen, klicken und Suchwörter tippen. Da erzeugen wir Unmengen von Datenpunkten, die (natürlich anonym und aggregiert) von schlauen Analyse-Experten  mit allen Regeln der Statistik untersucht werden. Dann zeigt sich, wie viel Rassismus den schwarzen US-Präsidenten Obama entgegen gebracht wurde oder ob wir – Freuds Ödipus-Komplex entsprechend – mit unserer Mutter schlafen wollen.

Der Autor ist begeistert von der digitalen Spielweise, die ihm die Datenmengen von Google ermöglichen. Er ahnt auch, dass diese Art von Forschung etwas anderes als herkömmliche Wissenschaft ist – hier werden nicht Daten erhoben, um Hypothesen zu testen, sondern man sucht solange in vorhandenen Daten, bis man etwas Interessantes finden. Deshalb wirken seine Befunde trotz der riesigen Anzahl von Datenpunkten und statistischen Analysen eher wie eine Revue von Anekdoten – empirisch gesammelt, aber theorielos interpretiert.

Das Buch „Everybody Lies“ liefert uns leider kaum neue psychologische und soziologische Erkenntnisse, dafür hilft es zu verstehen, was Big Data vielleicht künftig leisten kann, wenn Forscher diese Art von spielerischer Data Science mit der klassischen Sozialforschung verknüpfen.

Seth Stephens-Davidowitz: Everybody Lies – What the Internet Can Tell Us About Who We Realy are; London 2017, Bloomsbury, 338 Seiten, ca. 12 €, ISBN 978-1-4088-9470-5