Lektion 4: Nicht lesen! Nur analysieren! (Semantische Analysen)

In dieser Lektion öffnen wir endlich unser Analyse-Dokument. Mit einer Einschränkung: Es wird nicht gelesen! Wie man sich trotzdem dem Inhalt nähert, lernst du in dieser Lektion!

Dies ist die Lektion 4 von 8 des Kurses SEO am Beispiel MS Word und Windows Explorer. Da diese Lektion didaktisch versucht einen Spannungsbogen aufzubauen und dem User eine eigene Lösungsvariante einräumt, findest du hier und an Stellen weiter unten eine Link-Option direkt in die Lösung zu springen.

Zur Lösung.

Abstrakt: Wie finde ich etwas über den Inhalt eines Textes heraus ohne diesen zu lesen?

In der Lektion 4 des SEO-Kurses für Office-Anwender ist Lesen verboten – so ähnlich wie in vielen Reality-TV-Serien im Free-TV! Du kannst nun das Dokument cosmos-markt.docx öffnen, aber es wird nichts gelesen! (Scrollen geht aber!). Die Aufgabenstellung ist simpel:

Finde heraus, worum es in diesem Dokument geht ohne den Text darin zu lesen (oder die Bilder anzuschauen)!

Das Dokument wird übrigens über das Aufrufen des Ordners …\foodimpress-de\supermaerkte\ und das Doppelklicken auf das Word-Dokument cosmos-markt.docs geöffnet.

+++ ZEIT ZUM NACHDENKEN +++

Du kannst dir nun ein paar Minuten Zeit nehmen, um dir selber eine Antwort auf die Fragen zu notieren:

  • Finde heraus, worum es in diesem Dokument geht ohne den Text darin zu lesen (oder die Bilder anzuschauen)!

Alternativ kannst du auch weiter zur Lösung.


Lösung: Wörter mithilfe von Mathematik verstehen!

Wie bereits in der Lektion 1 angesprochen, wissen wir Menschen das leistungsfähige neuronale Netz, das wir als Gehirn mit uns herumtragen aus Gewohnheit gar nicht mehr zu schätzen. Lesen und Sehen sind Hochleistungsberechnungen, die unseren Gehirnen stattfinden. Lesen und Sehen sind ein Luxus, den die meisten Maschinen heutzutage nicht natürlich mitbringen.

Was Maschinen bzw. Programme aber normalerweise sehr gut können ist: Zählen und Vergleichen. Verständlicherweise eine Aktivität, die einem Menschen nicht direkt in den Sinn kommen würde, wenn er / sie einen Text vor sich hat (außer vielleicht es ist eine wissenschaftliche Arbeit mit Wort-Minimum, die vom Nachbarn abgeschrieben wurde). Aber genau das wird in dieser Lektion gefordert. Es gibt 3 einfache Wege, um herauszufinden was in diesem Dokument geschrieben steht ohne es zu Lesen:

  1. Wörter zählen
  2. Wort- / Begriff-Frequenzen berechnen
  3. Wörter und Begriffe suchen
Texte analysieren Lösung

1 | Wörter zählen

Tatsächlich könnte man bereits durch Zählen der Wörter erste Aussage über die Art des Dokumentes treffen. Nehmen wir nur mal ein paar Beispiele:

  • 5 Wörter = Whatsapp Nachricht
  • 8 Wörter = E-Mail vom Chef
  • 300 Wörter = Blogpost
  • 900 Wörter = Info-Seite / Aufsatz
  • 10.000 Wörter = Studentische Arbeit
  • 100.000 Wörter = Buch

Die Zahlen sind natürlich nicht fundiert – du verstehst aber hoffentlich worauf ich hinaus will.

Man könnte z.B. den Rückschluss zulassen das unser Dokument ein Aufsatz über einen Online Supermarkt ist. Diese Idee vom bloßen Zählen kann man natürlich beliebig weit treiben. PCs sind normalerweise auch recht gut darin einzelne Zeichen zu zählen. Ich könnte z.B. auch die Anzahl der „. „-Ausdrücke zählen, um einen Eindruck über die Anzahl der Sätze zu erhalten. Das ganze bekommt natürlich Momentum, wenn man hier noch Durchschnitte mit ins Spiel bringt. Ich könnte mir vorstellen, dass man – gegeben eine große Datengrundlage – anhand der durchschnittlichen Buchstaben pro Wort und durchschnittlichen Wörter pro Satz bereits Rückschlüsse auf die Sprache ziehen könnte, in der ein Text verfasst wurde.

2 | Wort- / Begriff-Frequenzen berechnen

Anlehnend an das Zählen von Wörtern und Zeichen kann ich zur Bestimmung der Themen eines Dokumentes auch die Wiederholungen von Begriffen und Begriffskombinationen innerhalb eines Textes erfassen. These dahinter ist, dass der wichtigste Begriff eines Dokumentes am häufigsten innerhalb eines Textes am häufigsten vorkommt. Das Ganze kann ich dann in absoluten Zahlen ausdrücken oder prozentual und die jeweiligen Nennungen absteigend sortieren.

Zu beachten ist, dass ein Thema nicht zwangsläufig nur aus einem Wort besteht. Nehmen wie das Beispiel Online Supermarkt, dann fällt auf dass wir hier das Vorkommen von 2-Wort-Kombinationen auswerten müssten.

Beispiel: Begriffsfrequenz-Tabelle (bereinigt)

#BegriffAnzahlFrequenz %
1Cosmos88%
2Online55%
3Supermarkt55%
..

Zu beachten bei dieser Methode ist die Tatsache, dass man typische Füllwörter aus Auswertung filtern muss. In der deutschen Sprache ist es – je nach Sprachstil – üblich, dass Wörter wie

  • der, die, das
  • so
  • aber
  • und, oder

häufig in Texten vorkommen ohne inhaltlichen Mehrwert zu stiften.

3 | Wörter und Begriffe suchen

Die dritte Analyse-Methode benötigt etwas Vorwissen. Aus den Lektionen 2 und 3 konnten wir bereits eine These entwickeln, worum es in dem geöffneten Dokument gehen könnte. Wir könnten in Folge einfach die Suchfunktion des Dokuments nutzen und prüfen, ob Begriffe die wir mit den Themen Online Supermarkt oder Cosmos Markt verbinden, in dem vorliegenden Text vorkommen.
In Microsoft Word ist die dazu passende Funktion unter der Tastenkombination Strg+F zu finden (genau wie in gängigen Webbrowsern). Es öffnet sich ein Suchfeld, in das du Begriffe wie Online Supermarkt, Cosmos Markt oder Paypal eingeben könntest.

Suchergebnis Word Dokument

Werden entsprechende Ergebnisse gefunden, weißt du mehr über den Text des Dokumentes als vorher!

Ergebnis: Text-Analysen für cosmos-markt.docx

Ich will deine Zeit ja nicht verschwenden und habe die entsprechenden Zähl- und Suchanalysen für das cosmos-markt.docx-Dokument bereits (maschinell) durchgeführt. Hier das Ergebnis:

Text Analyse Ergebnisse cosmos-markt Dokument

Transfer: Website-Texte sind nicht anders als Word-Texte

Der Transfer für die Lektion 4 ist nicht allzu weit hergeholt. Ob ich einen langen Text in einem Word-Dokument oder einer HTML-Datei vorliegen habe, macht keinen allzu großen Unterschied. Der Google-Bot wird womöglich ein paar Bereinigungen vornehmen, ehe er den Text analysiert und sich auf HTML-Tags wie h1, h2, h3, p, a, ul, ol, table, etc. beschränken, aber theoretisch ist das Prinzip das gleiche wie im Lektion-Setup.

Entsprechend steht auch das Kern-Dilemma: Maschinen, Crawler, Bots etc. können nicht wirklich lesen bzw. verstehen wie wir. Nichts desto trotz werden sie weiterentwickelt um trotzdem zum gleichen Ergebnis zukommen wie wir, wenn wir einen Text lesen.

Konkret: Mehr als nur Wörter zählen

Tatsächlich hat sich der Google-Suchalgorithmus seit seinen Anfängen viel mit Wörter zählen beholfen. Frühe Suchergebnisse haben neben Qualitätskriterien häufig vor allem auf In-Text-Frequenzen beruht. Diese einfach Art der Analyse musste seit Ende der 2010er dann zunehmend verbessert werden, da Optimierer (SEOs) natürlich irgendwann auf den Trichter gekommen sind und Texte ausschließlich für diesen Zweck geschrieben haben. Ich kann mich auch noch an meine frühen SEO-Tage erinnern, an denen Parolen für Texte so simpel wie stupide waren:

  • mindestens 300 Wörter-Texte
  • 3% Keyworddichte

Wenn man sich aber vorstellt, dass frühe Suchmaschinen-Texte teilweise Keyword-Dichten von über 20% für das Hauptthema hatten, kann man sich vorstellen, dass die resultierenden Texte nicht mehr sonderlich schön zu lesen, also nicht mehr benutzerfreundlich waren.

Heute nutzt Google verschiedene Methoden zur Bestimmung der Themen von Texten simultan. Dabei ist nur ein Teil dieser Mechnismen überhaupt außerhalb von Google bekannt (z.B. durch die Beantragung von Patenten). Man kann aber sagen, dass die heutigen Analyse-Methoden etwas stärker darauf achten, dass Texte sprachlich anspruchsvoll geschrieben sind und gewisse Stilmitteln enthalten, die echter Mensch einbauen würde. Dazu zählt unter anderem die Verwendung von Synonymen für ein Wort, das häufig verwendet werden muss oder die Verwendung von Absätzen und den Abgleich mit bekannten Wort-Clustern aus anderen Dokumenten und Suchergebnissen (siehe Lektion 3).

Es bleibt zu merken: Wer stilistisch gut und vor allem sachlich orientiert für Menschen schreibt, der sollte in der Google-Suche eigentlich keine Probleme haben, Traffic zu generieren. Ein paar Tipps für die Erhöhung des Lesewertes:

  • Vermeidung von Füllworten (so, nämlich, durchaus, etc.)
  • Verwendung von Absätzen
  • Reduzierung der Synonymisierung (wenn es um einen Online Supermarkt geht, muss das Wort Supermarkt auch gerne mal fünf mal vorkommen)
  • Kurze & prägnante Sätze (keine kunstvollen Schachtelsätze)
  • Vermeidung von emotionalen und subjektiven Zusätzen (z.B. durch Ich finde-Einleitungen)

Häufig gestellte Fragen zur Lektion

Wie kann ich in Microsoft die Wörter einer Textes zählen?

MS Word macht dies bereits automatisch. Das Ergebnis kannst du dir anschauen, wenn du im Screen unten links auf die Schaltfläche „XX Wörter“ klickst wird dir die Anzahl der Wörter im Dokument angezeigt. Außerdem zeigt es dir auch: Seiten, Zeichen (mit Leerzeichen), Zeichen (ohne Leerzeichen), Absätze, Zeilen.

Wo kann ich die Wörter einer Website zählen lassen?

Es gibt zum Zählen der Wörter auf einer Website diverse web-basierte Tools. Eine Google-Suche kann hier in vielen Fällen bereits Abhilfe schaffen. Die Analysen dieser Lektion habe ich mit dem Tool grillmeister-software.de machen lassen. Aber auch die Browser-Extension SEOQuake kann bei der Analyse von Anzahl von Wörtern behilflich sein.

Wo kann ich Wortfrequenz-Analysen für Websites durchführen lassen?

Es gibt verschiedene web-basierte Tools für Wortfreuqenz-Analysen. Eine Google-Suche kann hier in vielen Fällen bereits Abhilfe schaffen. Die Analysen dieser Lektion habe ich mit dem Tool grillmeister-software.de/ machen lassen.

Sind viele Wörter pro Seite gut für gute Suchmaschinen-Rankings?

Ja & Nein. Es gibt zwar eine Mindestanzahl von Wörter, die du pro Seite anpeilen solltest, allerdings ist es nicht so, dass jede deiner Unterseiten mit mehr Wörtern besser wird. 10.000 Wörter pro Seite mögen für viel Qualität sprechen, aber mit jedem neuen Absatz wird auch das eindeutige Thema der Unterseite verwässert für das du eigentlich mal in der Google Suche angezeigt werden wolltest. Viele gute Websites haben zwischen 500 und 3.000 Wörter.

Gibt es eine Mindestanzahl von Wörtern, eine Unterseite haben sollte?

Auch hier gibt es keine festen Regeln. Es ist allerdings erstrebenswert mindestens 200 Wörter pro Unterseite zu schreiben. Besser wären sogar 300 Wörter. D.h. nicht, dass Seiten mit unter 200 Wörtern kein SEO Traffic generieren können, aber die Wahrscheinlichkeit ist deutlich geringer.
Des Weiteren sind Seiten mit unter 200 Wörtern auch rein optisch relativ dünn bestückt und es stellt sich die Frage, ob man wirklich gute bzw. neue Informationen in so wenigen Worten vermitteln kann.