Um ein besseres Verständnis für Suche und Ranking zu erhalten versuchen wir uns in Lektion 1 in den Körper einer Maschine zu versetzen, um uns vorstellen zu können, begrenzte kognitive Möglichkeiten zu haben.
Um herauszufinden, welches Grundproblem eines Such-Anbieters ein Bot lösen soll, schaue noch einmal in der Intro-Sektion vorbei. Da diese Lektion didaktisch versucht einen Spannungsbogen aufzubauen und dem User eine eigene Lösungsvariante einräumt, findest du hier und an Stellen weiter unten eine Link-Option direkt in die Lösung zu springen.
Abstrakt: Stell dir vor, du bist ein Panda!
Um ein wenig besser in den Modus der Dokumenten-Analyse zu kommen ist es hilfreich, sich vorzustellen, man sei ein Panda:
Dieser Panda glänz vor allem durch drei Kern-Eigenschaften:
- Er ist extrem faul
- Er ist nicht sonderlich schlau – um nicht zu sagen „dumm“
- Es war jahrelang an der Uni und hat studiert
+++ Zeit zum Nachdenken +++
Du kannst dir nun ein paar Minuten Zeit nehmen, um dir selber eine Antwort auf die Frage zu notieren:
- Warum bin ich ein Panda?
- Was haben seine drei Eigenschaften mit Suchmaschinen-Optimierung zutun?
Alternativ kann du auch weiter zur Lösung.
Lösung: Deshalb bist du ein fauler, dummer Panda!
Wie es die Grafik in der abstrakten Darstellung bereits verrät, versuchst du dich in die Rolle des Google Bots zu versetzen. Etwas genauer gesagt, versuchst du dir vorzustellen, wie ein Crawler und ein Indexer vorgehen. Dafür ist die Analogie des Panda relativ passend. Und darum hast du die folgenden Grundeigenschaften.
Darum ist der Google-Bot / Panda faul:
Wie bereits in der Intro-Sektion erklärt, ist der Job des Bots eigentlich jede Website im Web tagesaktuell zu kennen. Das ist schier unschaffbar und in den meisten Fällen mit extrem hohen Server-Kosten, Speicherkapazitäten und / oder Rechenleistungen – sprich: Energie – verbunden. Entsprechend wird jede Software-Anwendung in diesem Ökosystem dahingehend programmiert, so viele Abkürzungen bei der Erfassung bei Websites wie es möglich ist. Dazu können z. B. auch zählen:
- Ermittlung von Indizes, die beschreiben ob Seiten häufig oder selten aktualisiert werden. Entsprechend kann der Panda / Bot bei den selten aktualisierten Seiten seltener vorbeischauen.
- Früh-Erkennung von No-Go-Signalen. Erkennt der Panda / Bot früh, wenn Seiten nicht Analyse-würdig sind, braucht er dort gar nicht weiter hineinschauen. Typische No-Go-Signale sind z.B. No-Index-Tags oder die Früherkennung von leeren oder minderwertigen HTML-Dateien.
- Optimierung von oberflächlichen Analysen. Wenn Methoden zur Dokumenten-Analyse bereits auf wenigen Datenpunkten funktionieren besteht weniger Bedarf tief in ein Dokument hineinzugehen, um weitere Datenpunkte zu erarbeiten. Entsprechend versucht der Panda sich viele Dokumente oberflächlich anzuschauen und wenige detailliert.
Darum ist der Google-Bot / Panda dumm:
Wie bereits erwähnt ist „dumm“ vielleicht etwas unfair gegenüber der Panda-Bevölkerung. Aber: Als Menschen sehen wir Fähigkeiten wie Lesen und Sehen häufig als so selbstverständlich an, dass wir die ungeheure kognitive Leistung die dabei in unserem Gehirn – hinter den Kulissen – völlig ausblenden. Software bzw. Maschinen können nicht direkt aus der Fabrik lesen! Und es braucht auch eine teils ungemeine Zeit einen Programm beizubringen, dass 5 Wörter hintereinander einen Satz bilden, der wiederum bis zu drei verschiedene Bedeutungen beim Leser haben können. Tatsächlich sind die Bemühungen von Technologie-Unternehmungen im Bereich Machine Learning gerade erst weit genug fortgeschritten, dass Maschinen rudimentär lesen und verstehen können.
Eine wirklich interessante Analogie dazu ist die Bezeichnung Neuronales Netz für unser Gehirn. Dieses kann dabei bessere Leistungen bringen als jede fortgeschrittene KI bei Tätigkeiten wie Lesen, Sortieren oder dem Interpretieren von Bildern und Bewegtbild-Material. Dabei gibt es auch in der Software-Entwicklung zwei verschiedene Ansätze von Software Konzepten: Programme, die Tätigkeiten wie Menschen ausführen (auch in der Codebase) und Programme, die Tätigkeiten anders als Menschen ausführen, aber zu dem gleichen oder einem vergleichbaren Ergebnis kommen. Dieser Perspektiv-Wechsel ist an vielen Stellen wichtig zu vollziehen, wenn man Suchmaschinen-Optimierung verstehen möchte.
So lässt sich über den Google-Bot / Panda festhalten:
- Er kann Dokumente nicht so gut verstehen / erfassen / analysieren wie ein Mensch es tun würde.
- Er kann dafür deutlich mehr Dokumente verarbeiten.
- Die Herangehensweise an die Tätigkeit der Erfassung und Analyse soll in vielen Fällen menschliches Verhalten imitieren.
- In anderen Fällen werden Unzulänglichkeiten der Software allerdings durch Verhalten / Analyseverfahren kompensiert, das Menschen nicht intuitiv in den Sinn kommen würde.
Der Panda war lange an der Universität und hat studiert!
Diese Aussage würde Punkt 2 „dumm“ intuitiv erst einmal wiederlegen. Allerdings kennen wir alle Menschen, die lange an der Uni waren, aber wenig Intelligenz präsentieren können. Für diese Panda-Eigenschaft möchte ich aber lediglich vorschlagen, dass wir einmal separieren a) Was wir wissen / gelernt haben und b) Wie wir Denken / lernen gelernt haben. Insbesondere im Fall b) sind Akademia bzw. Hochschulen ein besonders gutes Beispiel für Dokumentenstruktur.
An Hochschulen gibt es klare Anforderungen und Erwartungshaltungen wie Dokumente auszusehen haben. Es gibt deutliche Richtlinien wie Überschriften angeordnet sein müssen. Nummerierungen und Inhaltsangaben sind quasi religiöse Angelegenheiten bei der Produktion von Master-Arbeiten und Dissertationen. Es gibt sogar regeln wie korrekt zitiert und referenziert wird.
Dies ist für unseren Case SEO verstehen relevant, weil die Gründer und ersten Programmierer der Google-Suche Larry Page und Sergey Brin auch an der Stanford University an einem Lehrstuhl zu Hause waren ehe ihr Suchmaschinen-Venture groß wurde. Entsprechend lassen sich heute noch einige Dokumenten-Analysemethoden in Google-Software finden, die an einen Professor in der formalen Klausur-Korrektur erinnern. Deshalb ist es wichtig ein Dokument zur Suchmaschinen-Analyse gelegentlich wie eine Doktorarbeit anzuschauen und nicht wie eine Whatsapp-Message oder E-Mail. Aber auch für den Teil der Off-Page-SEO-Lektion wird dieses Learning nochmal interessant.
Häufige Fragen zur Lektion
Ich habe keine Indikation, die wissenschaftlich belegen würde, dass Pandas als Spezies als faul gelten. Es liegt auch keine Verwechslung mit Koala-Bären vor, die den Großteil ihres Tages schlafend verbringen. Nichts desto trotz würden Pandabären im Durchschnitt Menschen wahrscheinlich in Metriken wie Bewegungsradius oder Energielevel nachstehen.
Ich habe keine Indikation, die wissenschaftlich belegen würde, dass Pandas als Spezies als faul gelten. Auch wenn in verschiedenen viralen Videos suggeriert sind, dass Pandabären in der Metrik „Intelligenz“ anderen Tierarten wie Delphinen oder Schimpansen nachstehen würden, habe ich keine konkreten Aussagen zur Gesamtspezies vorliegen.
Larry Page und Sergey Brin sind die Gründer des Suchmaschinen-Konzerns Google, der mittlerweile Teil der Alphabet-Holding ist. Die beiden gründeten das Unternehmen und programmierten den Such-Algorithmus 1998 während ihrer Zeit als Doktor-Kandidaten an der Stanford University in den USA. Heute zählen die beiden zu den reichsten Menschen der Welt.
In meiner Definition ist ein Dokument eine Datei, die Informationen zur Einsicht bereithält. Diese Informationen können als Text, Tabellen, Bilder, Graphen und teilweise auch als Bewegtbild sein. Dokumente kommen in vielen verschiedenen Dateitypen daher und können viele unterschiedliche Datei-typische Endungen aufweisen: .docx, .pdf, .pptx, .html, .txt, …