Was von Cambridge Analyticas Psycho-Profil-basiertem Facebook-Micro-Targetting für Trump und Brexit übrig bleibt: Nix

Witzigerweise heißt der Mann von Cambridge Analytica Mr. Nix …

Das Thema wurde nach dem ursprünglichen Bericht in DasMagazin breit diskutiert, u.a. auch bei uns im Mikrooekonoemen Podcast (u.a. hier: Folge 27, bei der Lage der Nation und in nahezu allen großen Medien. Die drei Behauptungen von Cambridge Analytica waren im wesentlichen:

a) Wir [Cambridge Analytica) können mit ein paar Likes auf Facebook ziemlich viele Dinge über die Person sagen, die diese Likes abgegeben hat. Z.B. über das Geschlecht, über das Alter, über die Bildung, die sexuelle Orientierung, das Einkommen, den Wohnort, aber auch über das psychografische Profil (ängstlich/offen/kommunikativ/…) zum Beispiel die politische Ausrichtung (progressiv/konservativ) ableiten, etc. pp. Wir haben dieses Profil für über 200 Millionen Amerikaner auch bereits erstellt.

b) Mit diesem psychologischen Profil können wir hingehen, und über Facebook die Personen genauer ansprechen als jemals zuvor. Unter anderem, weil wir die Anzeigen, Nachrichten und Botschaften messen und testen können. Wir können maßgeschneiderte Nachrichten schicken, also zum Beispiel ängstliche Personen mit Angst (vor Ausländern, vor Einbrechern, …) ansprechen oder auch progressiven Wählern erzählen, dass Clinton gar nicht progressiv ist.

c) Wir haben das im Wahlkampf für Trump erfolgreich gemacht.

Neben vielen Detailfragen (die wir und andere dann auch diskutiert haben) stellten sich mir einige Fragen, die diese Geschichte im Laufe der Zeit immer unplausibler gemacht haben. Vor allem, weil die Antworten auf die Fragen, die nach dem ersten Bericht aufkamen, eigentlich mehr neue Fragen generierten als an alten Fragen beantwortet wurde.

Meine Hauptfragen waren:

zu a) Wie kommt Cambridge Analytica an die Daten von Facebook? Normal sieht ja nicht jeder alle Likes von jedem. Auch über die Programmierschnittstellen von Facebook nicht. Sicher, Facebook hat die Daten, aber alle draußen sehen nur Likes von "Freunden" und die Reaktionen auf eigene Artikel/Bilder/etc. Dadurch mag zwar bei großen Anbietern durchaus einiges an Daten zusammenkommen, außerdem kann man in den USA dank laschem Datenschutz eine Menge externer Daten einkaufen, für 200 Millionen Profile dürfte das trotzdem nicht ansatzweise reichen.

zu b) Selbst wenn man weiss, welches Profil (welcher Nutzer) welche Eigenschaften hat, kann ich diese Person über die Werbeschnittstellen von Facebook NICHT einzeln ansprechen. Facebook entscheidet nämlich alleine, nach welchen Kriterien gefiltert werden kann. Damit ist zwar viel genaueres Targetting möglich als in klassischen Medien, aber es ist immer noch weit weg von einer Ansprache auf Einzelpersonenebene. D.h selbst wenn ich weiss, dass ich den User 172.234 und 193.274 ansprechen möchte, kann ich das nicht, weil Facebook das nicht zulässt. Ich kann zwar sagen: Ok, 172.234 ist männlich, wohnt in Pittsburgh-Ost und ist 25-34 Jahre alt und progressiv (und ich muss ihn als Wahlkämpfer von Trump von der Stimmabgabe für Clinton abhalten), ich muss aber trotzdem Werbung kaufen, die dann an ALLE Männer in Pittsburg-Ost im Alter von 25-34 geht. Dieses Targetting ist zwar immer noch ein potenziell deutlicher Vorteil gegenüber einem gröberen Targetting, aber WEIT weg von der (Horror-?) Vision, die verbreitet wurde, dass jetzt Big Data Firmen alle Menschen auf Facebook kennen und jede Person einzeln für Werbung ansprechen können.

Und auch bei Punkt c gab es nie eine Bestätigung. Okay, logisch, wenn der Wahlkampf von Trumpf wirklich durch Cambridge Analytica entscheidend verbessert wurde, wäre Trump ziemlich doof, dieses Geheimnis öffentlich bekannt zu geben; es gibt schließlich in vier Jahren den nächstem Wahlkampf.

Bestätigt wurde nur das Engagement von Cambridge Analytica für Ted Cruz, aber das taugte nicht für Erfolgsgeschichte, Cruz verlor im Vorwahlkampf ja gegen Trump. Insbesondere interessant die Information der NYT heute, dass es genau aus dem Grund gestoppt wurde, mit dem Cambridge Analytica hausieren ging: Die Psycho-Profile haben schlichtweg nicht funktioniert, die Hälfte der vermeintlichen Supporter von Cruz wurden falsch identifiziert.

Weiter meldet die NYT unter Berufung auf Ex-Mitarbeiter aus Trumps Wahlkampfteam, dass Trump das Modell von Cambridge Analytica zwar getestet hat, es sich aber als "slightly less effective" als das schon vorhandene Targetting des Republican National Congress entpuppte.

Mitarbeiter von Cambridge Analytica waren wohl im Wahlkampf von Trump eingespannt, aber im Wesentlichen als Lieferant von Know-How, um relativ normales Targetting zu machen, das aber viel näher an dem Targetting von Obama von 1999 (man kennt kritische Wechselwählerbezirke auf Straßenzugebene und wandert von Tür zur Tür) war als an der angepriesenen magischen Kristallkugel mit Einzeltargetting der kritischen Wähler.

Die von Cambridge Analytica erwähnte Rolle für die Social Media Kampagne der Leave-Seite in der Brexit-Abstimmung gab es laut NYT übrigens auch nie.

Zusammengefasst: Alles, was aus den Zutaten Meinungsforschung, Werbetargetting und Big-Data zu einer Suppe gekocht wird: Die wird nie so heiß gegessen wie sie gekocht wird. Vor allem, wenn die Aussagen aus der Marketingabteilung der entsprechenden Firma kommt. Da gibt es dann gerne haltlose Aussagen, die manchmal auch nur äußerst knapp an der Lüge vorbeistreifen … Die Branche war für übergroße Versprechen schon immer anfällig …

NYT: Bold Promises Fade to Doubts for a Trump-Linked Data Firm

Update (09.03.2017):

Zwei Updates, die sich nach einer Diskussion auf Twitter ergeben haben:

Meine Aussage "Normal sieht ja nicht jeder alle Likes von jedem" ist nicht eindeutig. Natürlich kann jeder jeden Artikel und jede Seite (solange sie öffentlich geteilt sind) sehen und damit auch die Likes. Trotzdem ist es meines Wissens nach NICHT erlaubt, diese Informationen zu crawlen, also automatisch über Facebook-Seiten zu surfen und alle Likes einzusammeln. Wenn man Profile für 220 Millionen Amerikaner erstellen will, kommt man mit den Likes auf ein paar Artikel nicht sonderlich weit. Möglicherweise ist es möglich, mit weniger Seiten als ich jetzt denken würde, bereits sinnvolle Profile zu erstellen. Allerdings würde ich erwarten, dass man hier auf das Problem von "Sparse Data", also auf spärliche Daten, stößt, sprich man muss richtig viele Seiten und Posts crawlen, um eine vernünftige Datenbasis zu kommen. (Ob man damit dann sinnvolle psychografische Profile erstellen kann, ist damit noch lange nicht gesagt …). Also: Aussage ungenau, steht im Endeffekt aber noch.

Die zweite Aussage ist hingegen (wohl) falsch. Neben dem von mir beschriebenen Filtern der Zielgruppe auf Facebook, um dann Anzeigen zu schalten, hat Facebook eine neue Targetting-Möglichkeit: Die so genannten Custom Audiences. Das funktioniert so: man lädt seine eigenen Kundendaten hoch, also z.B. Telefonnummern, E-Mail-Adressen, Facebook-Namen, …). Diese Daten liegen übrigens nicht im Klartext vor, sondern werden "gehasht". Facebook sucht jetzt diese gehashten Daten (also z.B gehashte E-Mail-Adresse) in der eigenen Nutzer-Datenbank. Findet Facebook eine Übereinstimmung, wird die dazugehörige Facebook-ID in die "Custom Audience" eingetragen. Wenn man nun Werbung ausspielen will, wählt man als Zielkriterium einfach die passende "Custom Audience" aus und kann damit eine Gruppe ziemlich genau ansprechen. So wäre wohl eine direkte Ansprache möglich, falls Cambridge Analytica denn alle passenden Daten (E-Mail-Adressen, Telefonnummern, Facebook-Namen, …) hat. Da der Datenschutz in den USA aber gering ist und der Handel von personenbezogenen Daten ziemlich ausgeprägt ist, halte ich das für durchaus realistisch. (In Deutschland dürfte das sowohl mit dem Datenschutz Probleme geben (auch wenn das noch nicht endgültig geklärt zu sein scheint) und es dürfte deutlich schwieriger sein, ausreichend personenbezogene Daten einzukaufen (aggregierte Daten reichen ja nicht, darauf kann Facebook nicht matchen).

Zusammengefasst: Aus rein technischer Sicht ist das was Cambridge Analytica angepriesen hat, wohl denkbar. Der mögliche Knackpunkt ist das Crawlen der Daten auf Facebook und auch der Einkauf ausreichend vieler personenbezogener Daten. Das individuelle Targetting hingegen erscheint mir inzwischen möglich. Das ist aber nur die IT-Sicht auf das Problem. Was Cambridge Analytica aber weiterhin nicht bewiesen hat: Dass das psychografische Modell etwas taugt, dass das psychografische Modell überhaupt mit den oben beschriebenen Daten sinnvoll gefüttert werden kann. Und was wohl feststeht: Cambridge Analytica hat weder im Trump-, noch im Brexit-Wahlkampf die angepriesenen Methoden mit den Facebook-Likes und dem psychografischen Modell einen Einfluss, geschweige denn Erfolg vorzuweisen.

Danke an T. Preusse für das hilfreiche Feedback:



Eine weitere Zusammenfassung zum Thema gibt es bei der ZEIT: Die Luftpumpen von Cambridge Analytica

Update 2 (16.03.2017):

Dass die Custom Audiences keine Spinnerei sind, zeigt die ZEIT; wer Russia Today geliked hat, bekommt CSU Wahlwerbung auf Russisch ausgespielt:

Zu manchen spricht die CSU auf Russisch

0 Kommentare :

Kommentar veröffentlichen

Vielen Dank für Deinen Kommentar.

Related Posts with Thumbnails

egghats Amazonstore