Lektion 5: Ungelesene Dokumente vergleichen (Validierung)

Anschließend an die letzte Lektion, lernst du in Lektion 5 wie du und Google von bereits geleisteter Arbeit profitieren können und wie man Textanalysen unter Umständen outsourcen kann.

Dies ist die Lektion 5 von 8 des Kurses SEO am Beispiel MS Word und Windows Explorer. Da diese Lektion didaktisch versucht einen Spannungsbogen aufzubauen und dem User eine eigene Lösungsvariante einräumt, findest du hier und an Stellen weiter unten eine Link-Option direkt in die Lösung zu springen.

Zur Lösung.

Abstrakt: Wie vergleichen wir einen sehr guten Text und einen potenziellen neuen Text ohne diese zu lesen?

In den seltensten Fällen arbeiten wir oder unser Gehirn in der Bestimmung von Inhalten auf der grünen Wiese. Wir haben häufig eine erste Ahnung bezüglich eines Dokumentes oder eines Inhalt, die auf Erfahrungen aus der Vergangenheit beruht. Und auch Erfahrung beruht wiederum auf etwas, das wir bereits wissen. In dieser Lektion wissen wir auch schon etwas bzw. kennen wir etwas:

Ein Arbeitskollege und ausgewiesener Experte im Feld der Online-Supermärkte hat uns Dokumente per Mail geschickt, die das Thema Online Supermärkte bereits sehr gut abhandeln. Jetzt müssen wir nur noch wissen, wie wir diese Dokumente nutzen können, um unser neues Dokument cosmos-markt.docx damit analysieren zu können. Das Ganze natürlich wieder unter erschwerten Bedingungen:

Du darfst weder das cosmos-markt.docx-Dokument, noch die neuen Dokumente lesen!

Posteingang: Referenz Dokumente

+++ ZEIT ZUM NACHDENKEN +++

Du kannst dir nun ein paar Minuten Zeit nehmen, um dir selber eine Antwort auf die Fragen zu notieren:

  • Wie kann ich zwei oder mehr Dokument inhaltlich miteinander vergleichen ohne sie lesen zu müssen?
  • Wie kann ich ein neues, noch unbekanntes Dokument qualitativ mit einem bekannten Dokument vergleichen?

Pro-Tipp: Die Einschränkung „Nicht lesen“ bezieht sich hierbei auf dich als Panda / Google Bot. Bisher wurde an keiner Stelle davon gesprochen, dass niemand das Dokument lesen darf!

Alternativ kannst du auch weiter zur Lösung.


Lösung: Siehe Lektion 4 oder lasse andere für dich arbeiten

In der Tat gibt es für diese Lektion 2 Lösungen, die sich nicht gegenseitig ausschließlich, sondern parallel oder sequentiell durchgeführt werden können.

  1. Wir vergleichen die 7 Texte aus der Mail mit dem cosmos-markt.docx über die Metriken, die wir in Lektion 4 bereits für das neue Dokument ermittelt haben.
  2. Wir lassen andere Menschen die Texte und lesen und lassen unsere Fragen bezüglich des Inhalts über ein quantitatives Experiment beantworten.

1 | Textvergleich über Metriken und Word-Clouds

Wir haben 7 nachweislich gute Dokumente zu einem Thema und 1 neues Dokument für das wir lediglich eine thematische Vermutung haben. Wir haben noch keins der 8 Dokumente selber gelesen! Es ist aber sehr wahrscheinlich, dass das neue Dokument die gleichen Begriffe verwenden muss wie die 7 guten Dokumente, um das gleiche Thema zu vermitteln. Entsprechend könntest du nun die Analysen aus der Lektion 4 verwenden und jeweils 7 neue Spalten für die neuen Dokumente einfügen.

Skizziert könnte das Ganze so aussehen:

Wort-Frequenz-Messung

Begriffcosmos-
markt.docx
Text1Text2Text3
Online Supermarkt3,8%5,2%5,1%5,6%
Lebensmittel3,2%2,9%3,1%2,2%
Cosmos Markt5,4%1,2%1,0%1,1%

Es kann dabei auch helfen sich das Ganze als eine einzige große Tag-Cloud bzw. Word-Cloud vorzustellen. Überall schwirren Begriffe rum, aber auf den großen Begriffen sollten sich die Texte überschneiden.

Beispiel Wordcloud
Wordcloud von jasondavies.com/wordcloud/

Die gleiche Übung mit der Erweiterung der Metriken können wir natürlich auch für die Qualität des neuen Textes machen. So wäre es sinnvoll zu überprüfen, ob sich die Länge der Texte und die Wort- bzw. Satzlängen sich auch ähneln.

2 | Inhaltsvalidierung als quantitatives Experiment

Wie bereits in der Aufgabenbeschreibung erwähnt: Ich habe nirgends verboten, dass andere Menschen den Text lesen! Entsprechend ist es eine valide Option, andere Menschen das cosmos-markt.docx lesen zu lassen. In der Tat ist es eine valide Option, um herauszufinden, worum es in dem Text geht und es würde das Ganze auch in die wissenschaftlichen Spähren eines quantitativen Experiments heben – gegeben, dass genügend Menschen teilnehmen. Denn: Bei dieser Herangehensweise ist es wichtig, wie wir die Menschen zu dem Inhalt befragen!

We asked 100 people

Wichtig in dem ganzen Verfahren ist, dass wir die Probanden fragen, ob es sich um einen Text zum Thema Online Supermärkte und somit eine geschlossene Frage stellen! So würden wir z.B. 100 Probanden zu einem Test einladen und jedem würden die 7 bekannten Texte und der 1 neue Text vorgelegt. Am Ende jeden Textes würdest du Fragen stellen wie:

  • Geht es bei vorliegenden Text um Online Supermärkte?
  • Geht es bei dem vorliegenden Text um Lebensmittel?
  • Ist der vorliegende Text ansprechend geschrieben?
  • Beinhaltet der vorliegende Text alle Informationen, die du benötigst?

Je nachdem wie die Antworten der Probanden (Ja/Nein) für den neuen Text cosmos-markt.docx statistisch ausfallen, könnten wir entscheiden:

  • Geht in dem Text, um das Thema, das wir vermutet haben?
  • Ist der Text qualitativ hochwertig?

Dabei wären die 7 bekannten Texte vermutlich die Kontrollgruppe, die wir benötigen würden. Für die Zwecke dieser Übung müssen es nicht 100 Probanden sein – es würde mir schon reichen, wenn du deinen Arbeitskollegen mit der Bewertung beauftragst.

Die womöglich intuitive Lösung für die Involvierung von Dritten wäre der Arbeitsauftrag: Lies den Text durch und erzähl mir, worum es darin geht! Dieser Lifehack liegt sicherlich innerhalb der Parameter dieser Übung, allerdings hast du dann vergessen, dass du ein Panda bist: Du bist dumm und faul und hast entsprechend Probleme mit der Verarbeitung und dem Verständnis von langen Fließtexten. Einen solchen würde derjenige sicherlich produzieren und die vortragen!

Transfer: Google hat Millionen Probanden jeden Tag

Die E-Mail aus der Aufgabenstellung ist hier metaphorisch als die bestehenden Google-Suche#ergebnisse zu verstehen. Spezifischer die Seite 1 der Google-Suchergebnisse. Für jedes neue Thema, dass der Google-Bot / Panda in einem Dokument vermutet, gibt es schon mindestens 10 andere Dokumente in seinen Archiven, die andere User teils über Jahre für gut befunden haben. Entsprechend musst du dir als SEO bewusst sein, dass du mit jeder neuen Seite auf deiner Domain mindestens gegen 10 Dokumente antrittst, die die Suchmaschine für besser erachtet.

Dass der Bot die Textanalysen aus der Lektion 4 auch für die Referenz-Dokumente vorgenommen hat, sollte klar sein und die Verschmelzung dieser Analysen mit unser neuen Website sollte daher auch nicht allzu spannend sind. Spannender wird es allerdings bei der Betrachtung des vergleichenden Experiments, das Google mit seinen Usern durchführt.

Texte vergleichen SEO

Angenommen der Google-Bot wäre zu faul deinen Text zu analysieren, könnte er diesen auch ganz einfach für eine kurze Zeit zwischen neun anderen Ergebnissen auf der Suchergebnissseite zur Suchanfrage: Cosmos Markt Supermarkt anzeigen lassen. Von der Probanden-Gruppe, die in diesem Fall echte Nutzer wären, würde dann überprüft:

  • Sind die Meta-Daten (Lektion 2) inhaltlich ansprechend und klicken die User auf das Ergebnis?
  • Passt der Inhalt auf der Seite zu den Problemen der Nutzer und stellen sie Suchanfrage nicht erneut?

Durch diese beiden einfachen Ja/Nein-Fragen kann ein Algorithmus bereits sehr gut feststellen, ob das Thema aus der initialen Vermutung passend war und ob die Website geeignet ist, um sein Haupt-Dilemma zu lösen: Den Usern die richtigen Lösungen zu ihren Problemen zu präsentieren. Daran schließt sich dann entsprechend die Gretchen-Frage an: Wie gut bzw. wie viel besser als die anderen Websites? Dies führt dann aber bereits weiter in den Kontext des Rankings (z.B. 1 bis 10).

Konkret: SERP Click-Through-Rate und Bounce-Back-Rate

Nachdem einfache Textzählungsanalysen als alleiniges Analyse-Instrument vor einigen Jahren obsolet geworden waren, war die Hinzunahme von Nutzerdaten für die Erstellung der Google-Rankings ein Quantensprung in der Suchmaschinen-Optimierung. Die These dahinter ist einfach wie genial. Wenn 100 Leute mit dem Ergebnis, das sie auf Google gefunden haben, zufrieden waren, ist es sehr wahrscheinlich, dass auch User 101 mit diesem Ergebnis zufrieden sein wird. Google nutzt zur Beurteilung des Nutzerverhaltens vor allem zwei Metriken:

  • Click-Through-Rate (CTR) innerhalb der Suchergebnisseite
  • Bounce-Back-Rate zurück in die Google-Suche

Die Click-Through-Rate auf einer Suchergebnisseite wird dabei für jedes Snippet bzw. Ergebnis einzeln berechnet. Es setzt die Anzahl der Klicks auf das Snippet ins Verhältnis zu der Anzahl der Anzeigen des Snippets nach einer Suchanfrage. Daraus wird vor allem ermitteln, ob die Inhalte aus dem <title>- und <meta name=“description“>-Attribut einer Website für den Nutzer ansprechend gestaltet sind. Aber nicht nur die Gestaltung, sondern auch die rhetorische Konzipierung ist dabei von entscheidender Bedeutung. In der Vergangenheit konnten vor allem Snippets gute CTRs erreichen, die dem Nutzer die genau passende Lösung zur Suchanfrage versprochen haben oder die Suchanfrage des Nutzers Wort für Wort prominent wiederholt haben.

Anzahl der Klicks auf ein Snippet / Anzahl der Anzeigen eines Snippets x 100 = CTR (%)

Die Bounce-Back-Rate in die Google Suche beschreibt eine Kennzahl, die zugrunde legt, dass Nutzer, die finden was sie suchen, nicht wieder nach dem Problem suchen bzw. nicht zu den Ergebnissen zurückkehren. Die Kennzahl wird ebenfalls aus Snippet- bzw. Website-Ebene berechnet und von Google auch nicht öffentlich kommuniziert. Die Messung beginnt bei dem Klick auf ein Suchergebnis. Kehrt der Nutzer nach dem Klick relativ zügig wieder auf die Suchseite oder führt die gleiche Google-Suche erneut aus, wird er als Bounce gezählt. Grob würde die Gleichung dazu wie folgt aussehen:

Anzahl der Bounces je Snippet (unzufriedene Suchende bzw. Rückkehrer) / Anzahl User, die auf Snippet klickten x 100 = Bounce-Back-Rate (%)

Insbesondere die Bounce-Back-Rate-Messung ist ein großer Faktor in der Suchmaschinen-Optimierung geworden. Sie zwingt SEOs dazu ansprechende Seiten zu designen und nicht nur Textwüsten mit guten Meta-Daten bereitzustellen. Denn nur so können viele Nutzer heutzutage überhaupt noch dazu bewegt werden nicht wieder direkt in die Google-Suche zurückzukehren. Entsprechend sind klassische Fachbereiche wie SEO, SEA in den vergangenen Jahren auch immer weiter an angrenzende Disziplinen wie UX oder Frontend-Development herangerückt.

Häufig gestellte Fragen zur Lektion

Kann Google sehen was Nutzer auf meiner Seite machen?

Nein. Die Messungen von Google enden beim Klick auf ein Ergebnis in den Suchergebnisseiten und der Weiterleitung auf die Zielseite. Die Messung der Bounce Back Rate fixiert daher auch die Punkte des Klicks und des erneuten Betretens der Google-Website (hier kann dann wieder getrackt werden).
Diese Aussage kann auch trotz der Nutzung von Google Analytics aufrecht erhalten werden. Zum einen würde eine Anspielung der Analytics-Daten an die Suchdaten den Geschäftsbedingungen widersprechen. Zum anderen nutzen nicht alle Websites Google Analytics, sondern aandere Analysetools. Nach dieser Logik müssten also Websites die Piwik oder die Adobe Cloud nutzen schlechter bis gar nicht ranken, weil sie nicht nach diesen Daten evaluiert werden können.

Ist eine hohe CTR wichtig?

Für Google ist eine hohe CTR deiner Site in den SERPs erstmal ein guter Datenpunkt. Solltest du also wirklich gute Inhalte auf deiner Seite haben, wäre es ärgerlich, wenn Nutzer nicht klicken würden, weil ihnen dein Snippet nicht gefällt.
Auf der anderen Seite ist es hier wie mit anderen Klickraten: Sie sind nur Indikation für Interesse. Sie sagen nichts über Zufriedenheit, eine Transaktion oder Umsatz aus.

Was zeigt das Gameshow-gif?

Das .gif ist aus der Serie Family Feud. Die Serie ist quasi die amerikanische Version des deutschen Familienduell, das jahrelang von Werner Schulze-Erdel moderiert wurde. In der Sendung wurde jede Runde mit den Worten „Wir haben 100 Leute gefragt …“ begonnen. Entsprechend fand ich es passend zur Befragungsthematik.

Wo kann ich mir so eine Wordcloud für meinen Text generieren lassen?

Ich habe die Wordcloud aus dem Bild unter jasondavies.com/wordcloud/ generieren lassen. Aber mit eienr Google-Suche nach Wordcloud wirst auch noch weitere Anbieter finden.

Wo kann ich die Click-Through-Rate (CTR) meiner Website in der Google-Suche einsehen?

Google stellt dir diese Daten für jede deiner Unterseiten und Suchanfragen in der Search Console bereit. Im Report unter Performance kannst du dir die Metriken Klicks, Impressions, CTR und Average Position zu jedem Report anzeigen lassen.

Wie viele Suchen werden auf Google jedes Jahr durchgeführt?

Im Jahr 2017 wurden über 2 Billionen Suchanfragen weltweit beobachtet!