Vor längerem schon ist mir bei Google aufgefallen, dass einzelne meiner Blogtitel in den Suchergebnissen fehlen. Das heißt, ich füge den Titel eines Blogbeitrags in die Suchmaske ein, bekomme aber kein konkretes Ergebnis zurück, das zum Titel passt oder zu meinem Blog führt. Nachdem es mir oft genug aufgefallen war bin ich der Sache nachgegangen und meine, bei Google anhand dieser Unregelmäßigkeiten verschiedene Zensurmuster ausmachen können. Diese betreffen nicht nur meinen Blog, sondern auch zahlreiche andere.
Googles seltsames Suchmaschinengebaren
Den Kern meiner Analyse bilden 100 aktuelle Artikel auf meinem Blog. Der älteste davon stammt vom 8. April diesen Jahres, war zum Zeitpunkt der Suche ungefähr also drei Monate alt, während der jüngste vom 11. Juli stammt. Für alle diese Beiträge habe ich bei Google eine Titelsuche durchgeführt und mir notiert, welcher Art das Ergebnis war.
Insgesamt sind mir fünf unterschiedliche Ergebnistypen aufgefallen:
- Die einfache Titelsuche führt direkt zum Erfolg. Der Link zum Blog erscheint in den Ergebnissen und das in der Regel schon auf der ersten Seite.
- Die einfache Titelsuche bringt zwar den Link nicht zum Vorschein, allerdings kommt der Link zur Kategorie des Beitrags und es wird ein Ausschnitt aus dem Text selbst angezeigt.
- Die einfache Titelsuche führt ins Leere, sobald der Titel aber in Anführungszeichen gesetzt wird, hat Google kein Problem damit, den Beitrag zu finden.
- Die Titelsuche mit Gänsefüßchen bringt zwar nicht den Link zum Vorschein, allerdings kommt ein allgemeiner Link in Richtung meines Blogs.
- Die Suche auch mit Gänsefüßchen führt ins Leere, wobei das Ergebnis entweder rein gar nichts mit Bezug zu meinem Blog anzeigt, oder es erscheinen ausschließlich Links zu Drittseiten, die meinen Beitrag geteilt haben.
Zur Sicherheit bin ich die Liste mit den Beiträgen fünf Mal an durchgegangen und zwar an unterschiedlichen Tagen und zu unterschiedlichen Uhrzeiten. Folgende Verteilung kam dabei heraus:
Ergebnistyp | 1. Durchlauf | 2. Durchlauf | 3. Durchlauf | 4. Durchlauf | 5. Durchlauf | Ø = % |
(1) Ergebnis mit Link | 87 | 86 | 72 | 88 | 89 | 84 |
(2) Ergebnis mit Text | 0 | 0 | 5 | 0 | 0 | 1 |
(3) Gänsefüßchen Link | 11 | 11 | 7 | 9 | 9 | 9 |
(4) Gänsefüßchen Text | 1 | 1 | 2 | 1 | 0 | 1 |
(5) Griff ins Leere | 1 | 1 | 14 | 3 | 3 | 4 |
Wie zu erkennen ist, zeigt Google nicht nur Launen beim Erkennen der Titel, sondern scheint zu unterschiedlichen Tageszeiten auch andere Suchmuster zu verwenden. Es war bei den einzelnen Artikeln auch keineswegs immer der selbe Ergebnistyp, den die Googlesuche produzierte. Bei 34% aller Beiträge fanden sich beim Suchergebnis Variationen. Auch wenn die Mechanik der Suchmaschine heute zu einem Gutteil auf komplexen Lernalgorithmen beruht, hätte ich doch eine etwas höhere Konsistenz erwartet.
Die Gegenprobe habe ich jeweils mit Bing durchgeführt. Bei insgesamt vier Beiträgen von den 34, die bei der Googlesuche eine Variation aufwiesen, zeigte auch Bing nicht den einfachen Direktlink (Ergebnistyp1). Bei einem davon bin ich mir jedoch nicht sicher, ob der Link zu meinem Blog nicht doch vielleicht irgendwo versteckt in den Ergebnissen vorkommen könnte, da es um das Allerweltsthema Israel vs Hamas geht. Zwei weitere der vier drehen sich um Corona mit einmal einem Kommentar und einmal im Kontext zu China.
Der vierte Beitrag allerdings machte mich etwas stutzig, da er auch bei allen fünf Durchgängen durch Google nicht unmittelbar gefunden wurde. Inhaltlich geht es um einen Engländer, der sich für einen Koreaner hält und dahingehend umoperieren ließ. Trotz der Erweiterung auf den Kontext des Kulturkampfes hatte ich schon härtere Texte im Blog, bei denen Google allerdings keine Problem beim Finden hat. Möglicherweise liegt es daher am Begriff „Kindersex“, der in einer Zwischenüberschrift enthalten ist.
Die Interpretation wäre, dass Bing seine Ergebnisse bei Corona zensiert und eventuell auch bei sehr sensiblen Themen wie Pädosexualität. Netto liegt die Zahl der Variationen in den Suchergebnissen von Bing daher eher bei Null, denn bei vier. Bei Google jedoch lässt sich im Gegensatz dazu kaum eine rationale Erklärung finden, warum die Suche in so vielen Fällen in die Irre führte.
Auffällige Häufungen bei der Stichwortverteilung
Als zweiten Schritt nach dem Durchführen und Sortieren der Suchabfragen, habe ich die Ergebnistypen mit den zugehörigen Schlagworten verknüpft. Diese bestehen aus dem jeweiligen Themenkategorie des Artikels und dazu vergebe zusätzlich meist noch drei Stichworte zur Eingrenzung des Inhalts. Beides habe ich grob nach neun Themen sortiert und ihnen die Zahl der Ergebnisvariationen zugewiesen, wobei Ergebnistyp 1 den anderen vier gegenübergestellt werden soll.
Das Ergebnis findet sich in der folgenden Tabelle, wobei in der dritten Spalte die Relation zwischen erster und zweiter Spalte aufgeführt ist:
Schlagworte mit Variationen | Schlagworte mit Direktlink | Relation Variation zu Direktlink | |
Medienkritik | 13 | 10 | 1,3 |
China | 6 | 5 | 1,2 |
Klimawandel | 10 | 9 | 1,11 |
Islamismus | 6 | 6 | 1 |
gesamt | 126 | 286 | 0,44 |
Ökonomie & Geopolitik | 16 | 36 | 0,44 |
Kulturkampf | 19 | 49 | 0,39 |
Staatskritisches | 23 | 61 | 0,38 |
Eigennamen & Sonstiges | 30 | 95 | 0,32 |
Corona | 3 | 15 | 0,2 |
Hier lassen sich einige deutliche Auffälligkeiten ausmachen, die in Anbetracht von über 400 Schlagworten aus 96 Beiträgen mindestens in der Tendenz eine stabile Aussage erlauben. Generell geht aus den Häufigkeitsverteilungen der Tabelle die Aussage hervor, dass Google ganz offenbar seinen Suchalgorithmus manipuliert und bei bestimmten eine gezielte Ergebnispolitik betreibt.
Spezifisch sind all jene Themen zensuranfällig, deren Relation in der letzten Spalte in signifikanter Weise oberhalb von 0,44 liegt. Das wären: Der Islamismus, der Klimawandel, das kommunistische China und die Medienkritik. Effektiv bedeutet es, dass wer sich zu diesen Themen außerhalb des offiziellen Narrativs äußert, der muss damit rechnen, von Google bei den Suchergebnissen in der ein oder anderen Weise ausgebremst zu werden.
Diagnose: Totalitäre Machtfülle
Gegen meine Aufschlüsselung einwenden ließe sich, dass es zu einer verzerrten Einordnung der Schlagworte kam, da die Themen teilweise ineinander übergehen. Würden jedoch alle 27 Schlagworte jenseits der Erwartung unter „Eigennamen & Sonstiges“ den vier Themen mit gekippter Relation zugeordnet werden, dann läge die gemeinsame Relation der vier Themen mit 0,56 noch immer deutlich zu hoch. Eine Entzerrung hin zu einer natürlich erwartbaren Verteilung ist damit nicht möglich.
Hinzu kommt die politische Komponente in der Unternehmenskultur von Google. Diese ist links und sie folgt den typischen Themen und Neigungen, wie sie von der Klasse der globalisierten Linken vertreten wird. Jedes einzelne Thema, bei dem es in den Ergebnissen zu unerwarteten Abweichungen kam, spielt im linken Weltbild eine wichtige Rolle, um deren Deutungshoheit ein harter Kampf geführt wird.
Das gesonderte „Kuratieren“ von Suchergebnissen durch Google auch in Deutschland würde leider sehr gut in das größere Bild passen. Die obige Aufschlüsselung ist als deutliches Indiz dafür zu erachten, dass Google auch über unser digitales Verhalten eine totalitäre Macht ausübt. In den nächsten Teilen der Analyse werde ich nach weiteren Indizien für Zensurmuster suchen und versuchen, die Art und Weise einzugrenzen, wie genau der Algorithmus manipuliert wird.
Quelle Titelbild