Der folgende Text ist Teil eines SEO-Academy-Projekts, das ich in 2015 gestartet, aber niemals beendet habe. Jetzt ist er Teil des Bonusmaterials zum Academy Kurs SEO für PC-Anwender.
Nach dem letzten Beitrag Indexierung & Google-Bot aus der Serie SEO für Dummies wissen wir schon, dass der Google-Bot als Crawler eine ganze Menge Seiten in ganz einfachen HTML-Files auf ganz vielen Google-Servern speichert. Im Prinzip wie eine fleißige Arbeitsbiene die brav Honig abliefert, sich aber nie fragt, was man mit dem ganzen Honig eigentlich macht, wenn sie wieder weg ist. Jetzt wo wir aber so einen Wust aus Texten, Bildern (bzw. Ihren Referenzen), Styles und Informationen haben, brauchen wir noch jemanden der Sinn aus den ganzen Infos macht, die dort herumliegen und dann sogar noch die richtigen Files wiederfindet, wenn jemand danach sucht. Implizit erklärt diese Aufgabe auch, wie Rankings zustande kommen.
Themen der heutigen Märchenstunde sind deshalb:
- Aufbau der Google Suchmaschinen-Infrastruktur
- Was passiert zwischen Suchanfrage und Suchergebnis?
- Relevanz-Beurteilung von Webseiten und Dokumenten
- Eigenheiten beim Umgang mit Keywords und Semantik
- Um uns auf einem abstrakten Level der ganzen Sache zu nähern, stellen wir uns 2 nicht sonderlich clevere Supermarkt-Mitarbeiter vor, die folgende Hintergrund-Geschichte haben und folgende Funktionen einnehmen:
Robbie, der Supervisor – unser Indexer
Robbie ist ein Teamleiter/Aufseher im Supermarkt. Er ist nicht der Motivierteste in seinem Job, was dazu führt, dass er vorrangig den ganzen durch Supermarkt streift und hier und da mal in die Gänge schaut. Da er sich noch nie sonderliche viele Gedanken gemacht, wie denn der Markt überhaupt geplant und logisch aufgebaut wurde, merkt er sich die verschiedenen Orte nur sehr rudimentär. Läuft er irgendwo vorbei und sieht viele Konservendosen in einem Regal, ist er sich ziemlich sicher, dass es in dem Gang Konservendosen gibt. Ähnlich verhält es sich mit einem Gang durch die einzelnen Gänge. Wenn Robbie nach ein paar Tagen tatsächlich mal in den Gang mit den vielen Konservendosen geht, kann er schon wieder vergessen haben, dass er sich eigentlich im großen Bereich Konservendosen bewegt. Deshalb merkt er sich bei seinem 2. Gang vor allem, was er dann sieht. Und zwar: Bohnen, Bohnen, Bohnen, Bohnen … dann Nudeln, Nudeln, Nudeln, … Je mehr Nudeln er sieht, desto stärker verknüpft er den Ort, an dem er steht, mit dem Begriff Nudeln.
In Unserem Beispiel ist Robbie der Indexer im Google-System. Der Indexer geht durch alle Dokumente, die der Google-Bot auf den Server gelegt hat (Document Server) und merkt sich die signifikantesten Keyword-Nennungen in dem jeweiligen Dokument. Diese Informationen nimmt er und speichert sie wiederum in kleineren, handlicheren Dokumenten auf seinem Server (hier: Robbies Kopf / Index-Server).
Wenn ihr so möchtet, dann ist ein Gang ein großer Keyword-Bereich und ein Regal in diesem Gang ist Ihre Website. In einem Gang gibt es immer mehrere Regale und manchmal gibt es auch in 2-3 Gängen Konservendosen – für den Fall, dass wir später mal komplexere Suchanfragen benötigen
Zusammenfassend haben wir also folgende Elemente in dieser Geschichte:
- Einräumer der Regale = Google Bot
- Robbie = Indexer
- Gang = Keywordbereich / Thematisches Cluster
- Regal = Website
Pierre, der Greeter – unser Query Processor
Pierre ist unser zweiter Supermarkt-Mitarbeiter. Sein Job ist es ausschließlich vorne am Eingang des Marktes zu stehen, die Leute nett zu begrüßen und sie zu fragen, wie er Ihnen helfen kann bzw. was sie denn suchen würden. Im Gegensatz zu Robbie ist er super engagiert und immer nett zu allen Kunden. Allerdings hat er ein Kopf wie ein Sieb, d.h. für ihn ist der Supermarkt wie ein großes Labyrinth, das sich ihm nie erschließen wird – was ihn mit Robbie zu einem echten Dream-Team macht. Dieser Umstand führt nämlich dazu, dass Pierre jedes Mal wenn ein Kunde ihm mitteilt, was er sucht, auf schnellstem Weg zu Robbie läuft, ihn fragt, wo denn das entsprechende Produkt zu finden wäre und den Kunden dann zum entsprechenden Regal begleitet.
Am Regal selbst ist Pierre dann überdurchschnnittlich stark im Vergleich zu Robbie. Anhand der Anzahl der Produkte in den Regalen, ihrer Anordnung und seiner Erfahrung, kann er dem Kunden genau sagen, wo er am wahrscheinlichsten sein Produkt findet. Dies gepaart mit Pierre’s Verkaufstalent, geht der Kunde nahezu immer zufrieden aus dem Laden.
In unserem Beispiel ist Pierre der Query Processor von Google. Er nimmt die Suchanfrage an, die ihr immer in das kleine Suchfenster tippt. Der Query Processor ist dafür zuständig die Suchanfrage zu nehmen, über den Indexer die Dokumente zu finden, die am besten auf die Anfrage passen und diese Dokumente dann nach Relevanz sortiert und in Form einer Suchergebnisseite dem Kunden zur Auswahl vorsetzt.
In unserem Supermarkt-Beispiel würde das Ganze dann ja wie folgt aussehen: Pierre begrüßt eine Kundin am Eingang, die ihm prompt ein spezifisches Produkt nennt, das sie benötigt. Dann geht er schnellstmöglich zu Robby dem faulen Supervisor und fragt ihn wo er denn zuletzt die meisten Produkte mit der Beschreibung des Kunden gesehen hat. Nimmt den Kunden mit zum Gang und Regal. In Bruchteilen einer Sekunde zählt Pierre im Gang dann die Anzahl der Produkte im Regal und gibt dem Kunden zwischen 1 und 100 Produkte nacheinander zur Evaluation. Dabei beginnt er mit dem, von dem er glaubt, dass es am besten zu den Wünschen des Kunden passt.
Suchanfragen verarbeiten – Ich hätte gerne ein paar Konservendosen mit Nudelgerichten
Nehmen wir uns mal ein konkreteres Szenario vor: Eine Kundin kommt in den Laden und sagt zu Pierre: “Ich hätte gerne Konservendosen mit Nudelgerichten!”. Ähnlich wie Google versteht Pierre nur das Wesentliche der Anfrage: Ich hätte gerne Konservendosen mit Nudelgerichten! Pierre läuft straks zu Robbie und fragt ihn, wo er denn zuletzt viele Konservendosen mit Nudelgerichten gesehen habe. In Robbie’s Fall hatten wir gesagt, dass er keine sonderlich lange Aufmerksamkeitsspanne hat. Deshalb muss er sich auch 2 Fragen nacheinander stellen. Wo habe ich zuletzt viele Konservendosen gesehen? (Haus 2) Wo habe ich zuletzt viele Nudeln gesehen? (Gang 4). Entsprechend bekommt Pierre von Robbie die Antwort: “Haus 2, Gang 4!” Am Gang angekommen schaut er sich alle Regale in diesem und dem Nebengang an. Er zählt alle Produkte durch. Dann zählt er die Produkte durch, die Konservendosen sind. Dann nur die, die auch Nudelgerichte beinhalten. Am Ende bleibt er vor dem Regal stehen, das die meisten Konservendosen mit Nudelgerichten im Verhältnis zu den gesamten Produkten im Regal hat. Es sind 10 verschiedene Produkte dort übrig. Er beginnt der Kundin die Nudelgerichte anzugeben, die er am geeignetsten hält. Dabei evaluiert er vor allem nach folgenden Kriterien:
- Größe des Titels Nudelgerichte
- Länge der Zubereitungsanleitung
- Verständlichkeit der Zubereitungsanleitung
- Design der Verpackung
- Zufriedenheit der vergangenen Kunden mit Produkt
- …
Schon eine Vermutung was die einzelnen Komponenten der Suchmaschinen-Optimierung waren? – Dann bist du ein echter Checker!
Dann schauen wir uns mal an, was in den verschiedenen Schritten im Supermarkt in der Google-Welt passiert:
Die Kundin sagt: Ich hätte gerne Konservendosen mit Nudelgerichten!
> Ein User schickt eine Suchanfrage ab.
Pierre merkt sich nur Konservendosen & Nudelgerichte.
> Der Query Processor vereinfacht die Suchanfrage, da er weiß, dass Stopwörter wie “und, ist, als, wie, …” im weiteren Verlauf nicht zur Qualifizierung der Suche helfen werden.
Robbie überlegt, wo er zuletzt Konservendosen und Nudelgerichte zusammen gesehen hat.
> Der Query Processor benutzt den Indexer um die Anzahl der Dokumente zu reduzieren, die er sich noch anschauen muss. Dies macht er, indem er Filter über das Inhaltsverzeichnis (Index-Server) laufen lässt. Der erste Filter heißt: “Zeig mir, wo ich alle Dokumente finde, die Konservendosen enthalten!” Dann müssen diese Dokumente erneut spezifiziert werden: “Nimm alle Dokumente aus dem 1. Filter und zeige mir aus denen die Dokumente, die das Wort “Nudelgerichte” enthalten!”
Pierre erreicht mit der Kundin den richtigen Gang in Haus 2, Gang 4.
> Der Query Processor hat zwar schon in etwa die richtigen Dokumente gefunden, muss aber noch eine deutliche Reduzierung vornehmen damit der Google am Ende nur 10 interessante Rankings zur Auswahl hat.
Er reicht der Kundin die ersten 10 Produkte an, die er nach Bedeutung für die Bedürfnisse der Kunden evaluiert hat, nachdem er alle Produkte in den Gängen durchgezählt hat.
> Er baut die erste Suchergebnisseite. Die Ergebnisse nach denen die Dokumente später gewichtet sind, sind primär die Keyworddichte. D.h. Google zählt wie oft die Begriffe “Konservendosen” und “Nudelgerichte” im Text und anderen Elementen der Seite vorkommen. Das Dokument, das die Begriffe am häufigsten im Verhältnis zur Anzahl der Wörter beinhaltet scheint am relevantesten. (Dieser Teil ist nicht mehr ganz zeitgemäß, passt aber aus didaktischen Gründen besser). Die anderen Relevanz sind folgende:
Prominenz des Keywords (Größe des Titels Nudelgerichte)
Hier wird geschaut wie prominent das Keyword platziert wurde. D.h. findet es sich in URL, Der 1. und 2. Überschrift der Seite, Meta-Title und -Description (dazu in einem weiteren Artikel mehr). Hier werden vorrangig Seiten benachteiligt, die das Keyword erst gegen Ende der Seite nennen oder gar meinen der funktionale Produktname hätte nichts auf der Dose zu suchen. Beispiel wäre hier “Cookfresh 1.2.”.
Textlänge (Länge der Zubereitungsanleitung)
Hier wird geschaut, wie viel Mühe sich der Autor des Dokumentes mit der Textgestaltung gemacht hat. Damit ein Text eine gewisse Expertise vermittelt sollte er wenigstens schon zwischen 150 und 300 Wörtern haben. Andernfalls hilft auch die beste Keyworddichte nichts.
Seitenaufbau und Layout (Verständlichkeit der Zubereitungsanleitung + Design der Verpackung)
Da Google HTML lesen kann, kann es auch sehen wie eine Seite gebaut wurde. Wichtige Kriterien hier sind z.B. ob die Seite einfach zu lesende Bullet-Points besitzt, nicht wie eine Blei-Wüste aussieht und nicht 1.000 (eher 3) Werbeanzeige im initial sichtbaren Bereich (Viewport) zeigt.
Suchergnisseiten-Performance des Ergebnisses (Zufriedenheit der vergangenen Kunden mit Produkt)
Da ihr immer von einer google.com-Seite auf eine Website zugreift kann Google mittlerweile ganz gut sehen / tracken wir zufrieden User mit einem Suchergebnis sind. Am einfachsten geht das, indem sie schauen wie schnell der User wieder eine Suchanfrage stellt oder auf die Suchseite zurückkehrt. D.h. Webseiten, die schon auf der Suchergebnisseite nicht häufig geklickt werden (trotz guter Platzierungen) und Webseiten, von denen Leute schnell wieder zurückspringen (Bounce-Back-Rate), werden im allgemeinen als weniger relevant zu den Suchanfragen angesehen. In der Welt von Robbie und Pierre wären das Produkte, die häufig zurückgebracht werden oder auch jene über die sich Kunden beschweren.
Die Grenzen und Entwicklungen der Suchmaschine
So. Jetzt wisst ihr eigentlich schon genau, wie Suchergebnisse zustande kommen. Ich möchte keinen unter Druck setzen, aber normalerweise kann man mit diesem rudimentären Verständnis schon sehr gut für sich selber entwickeln, wie man mit seiner Website gute Rankings erreicht. Man muss sich dabei einfach immer nur fragen: Wie würden Robbie und Pierre meine Seite finden. 😉
Wer jetzt noch Lust hat, der kann gerne weiterlesen und sich ein paar Szenarien anschauen, die für einen Suchroboter nicht so einfach umzusetzen sind, wie für einen Supermarktmitarbeiter oder für einen Menschen in diesem Kontext. Interessant wird es hier vor allem, wenn wir uns in sprachliche Details verstricken.
Die Kundin sucht nach Fertiggerichten. Um bei unserem Beispiel von gerade zu bleiben: Eigentlich sucht die Kundin nichts anderes Konservendosen mit Nudelgerichten. Das ist für uns relativ einfach zu verstehen (Nudeln + Konservendosen = Fertiggerichte). Allerdings hat Google diese Gleichung nicht zwangsläufig im Kopf. Für den Indexer Robbie, der ja nicht sonderlich clever ist, wäre das eine ganz andere Anfrage an seinen Kopf. Außerdem würde es Voraussetzen, dass er die Konservendosen bei einem seiner Spaziergänge schon einmal als potenzielle Fertiggerichte wahrgenommen hat.
Was bedeutet das für meine Suchmaschinen-Optimierung? Auch wenn Google mittlerweile viele semantische Zusammenhänge begreifen kann, heißt das nicht, dass ihr mit einer Unterseite für “Fertiggerichte” gleichzeitig auch für “Konservendosen mit Nudelgerichten” rankt. Im Zweifel sollten für beide Keywords unterschiedliche Unterseiten mit unterschiedlichen Texten existieren.
Das Problem mit der Birne für das Wohnzimmer
Das Szenario, dass eine Kundin in den Laden kommt und eine “Birne für ihr Wohnzimmer” sucht, stellt Robbie in unserem Beispiel vor ein sehr witziges Problem. Allein aus dem Keyword “Birne” könnte er die beiden anderen nämlich in die Obst-, Konserven- oder Non-Food-Abteilung schicken, wo es die Glühbirnen gibt. Da Robbie nämlich in allen drei Abteilungen Birnen gesehen hat und ihm eigentlich egal ist, was die Kunden später mit den Produkten machen (oder wo sie es machen), braucht er nämlich Mechanismen in seinem Kopf, die ihm zum einen Verraten, dass Wohnzimmer etwas mit Strom, Watt und Schaltern und zutun und dass neben diesen Arten von Birnen meistens im Gang nebenan Batterien, Kochtöpfe und Staubsauger stehen.
Google hat diese Form der semantischen Analysen in den vergangen Jahren definitiv verbessert und sogar in die Relevanz-Bewertung verschiedener Seiten eingebaut. Das ist auch der Grund warum ich so ungern behauptet habe, dass Pierre die Produkte aufgrund der Anzahl der Keywords in einem Dokument bewertet. Für Websiten-Betreiber und -Texter heißt das aber auch, dass die Texte einer Unterseite sich nicht nur mit dem Kern-Keyword beschäftigen müssen, sondern auch alle verwandten Wörter beinhalten sollten. So ist es ja üblich auf der Produktseite einer Glühbirne die Watt-Zahl, die Größe, den Stromverbrauch und weitere Produktdetails anzugeben.
Große Marken in den Suchergebnissen – Vorteile durch hohe Markenbekanntheit auch online ein Thema
Eine Sache, die man schnell feststellt, wenn man eine kleine No-Name-Website an den Start bringt: Auch wenn man mehr von SEO weiß und die Dinge, die man auf seiner Website beschreibt, besser kennt als jeder andere auf der Welt. viele Seiten von Marken wie VW, Sony, Dell, Apple und Co. ranken immer vor einem. Dies liegt vor allem daran, dass Robbie, Pierre und alle Kunden Werbung schauen, wenn sie nicht im Supermarkt sind. Genau. Auch Google weiß, dass Marken in vielen Fällen Äquivalente für bestimmte Suchanfragen sind. Zum einen weil die Markennamen in vielen Dokumenten auf den Servern häufig vorkommen und zum anderen, weil Kunden sie in Verbindung mit Keywords in den Suchschlitz eingeben. Daher kann es vorkommen, dass auch Pierre einer Kundin plötzlich ein Produkt zuerst empfiehlt, das von einer Marke produziert wird, die er aus dem Fernsehen kennt, auch wenn die Kundin nie explizit nach einer spezifischen Marke gefragt hat. Dahinter steht bei Pierre und bei Google die Hoffnung, dass die Kundin mit dem Markenprodukt eine bessere Experience hat als mit den No-Name-Produkt – was in vielen Fällen sogar eintritt. Dieser Markenbonus setzt sich übrigens auch über die Supermarkt-Gänge hinaus. So kann kommt es vor, dass vor, dass Erasco sogar von Beginn an gut rankt, wenn sie ihre neue Shampoo-Linie herausbringen, auch wenn diese nichts mit den Fertiggerichten zutun haben.
Der Take-Away für den SEO ist dabei vor allem, dass es sich lohnt die Ausbildung einer Marke zu investieren. Wenn tatsächlich Geld für TV-Spots, Sponsoring und Print-Werbung da ist, kann das auf Dauer nur gut sein für das Ranking. Dies geht sogar so weit, dass negative PR in manchen Fällen deutliche Ranking-Gewinne einfahren kann.
Fazit
Wenn wir zurückblicken auf das, was wir heute gelernt haben, ist es vor allem wie wichtig es ist Googles Automaten (hier: Robbie und Pierre) Hilfestellungen bei der Zuordnung von Webseiten in thematische Cluster und Keywords zu geben. Weder der Indexer, noch der Query Processor sind sonderlich clever, wenn es darum geht Rätsel auf euren Websites zu lösen. D.h. schreibt hin, was ihr anbietet und ihr werdet in den Suchergebnissen empfohlen. In Detail sehen die Learnings also wie folgt aus.
Die technische Infrastruktur bei Google ist viergeteilt:
- Der Google-Bot speichert Documente auf einem Server ab (Document Server)
- Der Indexer schaut die Dokumente durch und legt die Keywords darin in einem Inhaltsverzeichnis ab (Index Server)
- Der Query Processor holt sich die Suchanfrage beim User ab, findet Dokumente mithilfe des Indexer, evaluiert diese auf Relevanz und legt sie am Ende dem User als Vorschlag vor (Suchergebnisseite)
- Dokumente mit einer häufigen und prominenten Keyword-Nennung haben eine gute Chance auf ein Ranking
- Neben einem Fokus-Keyword ist es wichtig verwandte Keywords aus der Welt des Fokus-Keywords auf der Unterseite zu verwenden
- Es ist hilfreich, wenn sich eine Domain ohnehin schon im thematischen Bereich des Keywords etabliert hat
- Eine offline bekannte Marke zu haben, kann sich überdurchschnittlich positiv auf die Rankings in einer Suchmaschine auswirken.
Der Artikel “Indexierung und Google-Bot: SEO für Dummies Teil 1” erscheint als Teil einer Reihe von Beiträgen, die SEO-Newbies und -Noobs die Prozesse in der Suchmaschine näherbringen sollen.
SEO für PC Anwender – der Kurs
Wenn du nach Fortbildung im Bereich SEO suchst, kann ich dir den internetzkidz Kurs SEO für PC-Anwender empfehlen. Der 8-Lektionen-Kurs ist Teil der internetzkidz-Academy.