SEO-Geheimwaffe: Die Google Cloud Natural Language API

Ein Beispieltext unter dem Menüpunkt “Entitäten” in der Google Cloud Natural Language API. Im Vordergrund ist das Logo von Google dargestellt.

Die Google Cloud Natural Language API basiert auf der gleichen Technologie, die Google auch in seinem Suchalgorithmus verwendet, um Texte zu verstehen.

  • Ich zeige dir Schritt-für-Schritt, wie du mit der Natural Language API von Google Entitäten aus einem Text extrahieren kannst.
  • Wie du mit dem Einbau von Entitäten auf deinen Seiten deine Rankings verbesserst.
  • Welche SEO Best Practices du zusätzlich beachten solltest.

Inhalt

Was ist die Google Cloud Natural Language API?

Mit der Natural Language API von Google Cloud können Texte mithilfe von maschinellem Lernen analysiert werden. Eine API (Application Programming Interface) ist eine Programmierschnittstelle, mit der verschiedene Softwareanwendungen miteinander kommunizieren und Daten austauschen können. 

Hier ein Beispiel zum Verständnis:

Ein Softwareentwickler erstellt eine Anwendung, bei der die Nutzer miteinander chatten können. Mithilfe der Natural Language API von Google kann dieser, die Funktionen, die Google Cloud bereitstellt, für seine eigene Anwendung nutzen (zum Beispiel Hasskommentare durch maschinelles Lernen erkennen). 

Für die Zwecke in diesem Artikel benötigst du jedoch nur die kostenlose Natural Language API – Demo:

👉 https://cloud.google.com/natural-language?hl=de

Eine Anmeldung ist nicht notwendig. Scrolle einfach zu dem Eingabefeld hinunter:

Das Eingabefeld der Google Cloud Natural Language API mit dem Platzhaltertext.

In dieses Feld kannst du die Texte deiner Seite oder die deiner Konkurrenten reinkopieren und dir alle von Google erkannte Entitäten anzeigen lassen.

Die Grundlagen

Bevor du beginnst, deine Texte und die deiner Konkurrenten zu analysieren, ist es wichtig zu verstehen, was Entitäten sind und wie diese sich von Keywords unterscheiden:

Was sind Google Entitäten?

Google Entitäten sind eindeutig zu bestimmende Dinge, die Google in einer Datenbank – dem sogenannten Knowledge Graph abspeichert. Jede Entität hat eine einzigartige Kennnummer und kann meist mit unterschiedlichen Worten beschrieben werden. 

Das Land Deutschland ist zum Beispiel eine einzigartige Entität, kann aber unterschiedliche Namen haben. So könnten Nutzer auf Google mit den folgenden Suchanfragen nach dieser Entität suchen: 

  • Deutschland 
  • Bundesrepublik Deutschland
  • Deutsches Land
  • usw.

Hier kann Google das eingegebene Keyword der korrekten Entität in seiner Datenbank zuordnen und dadurch jeweils das gleiche Suchergebnis anzeigen.

Google erkennt den Kontext in einem Text

Googles Algorithmen verwenden maschinelles Lernen und können dadurch zum Beispiel identische Wörter in verschiedenen Kontexten der richtigen Entität zuordnen:

Das Eingabefeld der Google Cloud Natural Language API mit dem Beispieltext: “Ich gehe morgen auf einen Ball in der Stadthalle Wien.“

In diesem Beispiel versteht Google, dass es sich bei dem Wort Ball um die Entität handelt, die ein Event beschreibt.

Das Eingabefeld der Google Cloud Natural Language API mit dem Beispieltext: „Ich muss einen neuen Ball kaufen, um wieder Fußball spielen zu können.“

In diesem Beispiel versteht Google, dass es sich bei dem Wort Ball um die Entität handelt, die ein Konsumgut beschreibt.

Warum Entitäten so effektiv für SEO sind

Durch die erkannten Entitäten kann Google abschätzen, ob es sich um einen Text mit hoher Qualität handelt. Grund dafür ist, dass Texte, die von Experten geschrieben wurden, in der Regel andere Entitäten enthalten als von Laien verfasste Texte. Zudem kann Google Texte, die mehr der relevanten Entitäten enthalten, einfacher dem korrekten Thema und somit den geeigneten Suchanfragen zuordnen.

So extrahiert du die Entitäten aus einem Text

Nehmen wir an, du willst für das folgende Keyword ranken:

“Ist Cannabis gesund”

Um auf die erste Seite von Google zu gelangen, sollte Google in der Lage sein, genug relevante Entitäten in deinem Text zu erkennen. 

In diesem Beispiel befindet sich auf der ersten Position bei Google ein Artikel der Stiftung Gesundheitswissen. Kopiere zunächst den gesamten Text der Seite inklusive Überschriften:

Ein Beispielartikel von der Seite Stiftung Gesundheit, der aufgrund seiner hohen Expertise sehr hoch bei Google rankt.

Füge den Text in das Eingabefeld der Natural Language API Demo ein und klicke auf Analyze:

Im folgenden Abschnitt gebe ich dir eine kurze Übersicht über die Menüs der Google Cloud Natural Language API:

Die Menüs der Natural Language API

1) Entities (Entitäten)

Das Eingabefeld der Google Cloud Natural Language API mit einem eingefügtem Text.

Hier siehst du die Entitäten, die Google in dem Text erkannt hat:

Der Menüpunkt “Entities” in der Google Cloud Natural Language API.

Die Entitäten, die Google in dem Text erkannt hat, sind farbig kopiert.

2) Sentiment

Hier wird eine Sentimentsanalyse des Textes durchgeführt, bei der die einzelnen Sätze eingeteilt werden in solche, die eine positive, negative oder neutrale Stimmung vermitteln.

Der Menüpunkt “Sentiment” in der Google Cloud Natural Language API.

Sätze, die eine positive Stimmung vermitteln, sind grün, Sätze, die eine negative Stimmung vermitteln, rot dargestellt.

3) Moderation

Auf Basis der extrahierten Entitäten wird mit einer Wahrscheinlichkeit von 0 bis 1 angegeben, wie wahrscheinlich der Text bestimmte sensitive Inhalte enthält.

Diese Funktion ist vor allem für Anwendungen relevant, bei denen viele Texte von Usern selbst erstellt werden. Die API kann dann zum Beispiel als Frühwarnsystem für mögliche verbotene Inhalte eingesetzt werden.

4) Categories

Der Menüpunkt “Moderation” in der Google Cloud Natural Language API.

Auf Basis der extrahierten Entitäten wird mit einer Wahrscheinlichkeit von 0 bis 1 angegeben, wie wahrscheinlich der Text zu einer bestimmten Kategorie passt.

Der Menüpunkt “Categories” in der Google Cloud Natural Language API.

Je mehr passende Entitäten Google in einem Text findet, desto einfacher ist die Zuordnung zu der richtigen Kategorie.

Relevant für SEO sind die erkannten Entitäten unter Entities. Hier findest du die erkannten Entitäten, durch die Google abschätzen kann, wie viel Expertise in einem Thema ein Text besitzt und zu welchen Kategorien dieser Text gehört.

Doch wie kann Expertise, die Expertise eines Textes nur durch Entitäten abgeschätzt werden? Schauen wir uns hierfür einige spezifische Entitäten an, die vermutlich weniger in Texten von Laien zu finden sind:

So werden in dem Text unter anderem die folgenden Organisationen genannt:

Beispieltext unter dem Menüpunkt „Entities“ in der Google Cloud Natural Language API. Markiert sind die Begriffe im Text, die als „Organizations“ erkannt wurden.

Folgende Personen:

Folgende Events:

Beispieltext unter dem Menüpunkt “Entities” in der Google Cloud Natural Language API. Markiert sind die Begriffe im Text, die als “Events” erkannt wurden.
Beispieltext unter dem Menüpunkt “Entities” in der Google Cloud Natural Language API. Markiert sind die Begriffe im Text, die als “Persons” erkannt wurden.

Folgende „Konsumgüter“:

Beispieltext unter dem Menüpunkt “Entities” in der Google Cloud Natural Language API. Markiert sind die Begriffe im Text, die als “Consumer Goods” erkannt wurden.

Die relevanten Entitäten (Schwerpunktpraxen, Suchtambulanzen, Psychopharmaka, etc.) zeigen dem Leser und Google, dass es sich hier vermutlich um einen Text mit hoher Expertise handelt. Zudem kann Google durch das Erkennen der Entitäten den Text sicherer zu den richtigen Themen und somit auch den richtigen Suchanfragen zuordnen:

Der Menüpunkt “Moderation” in der Google Cloud Natural Language API. Markiert sind die Kategorien “Health” und “Illicit Drugs”.

Aufgrund der erkannten Entitäten kann Google Texte den richtigen Themen zuordnen. Dadurch können Nutzern verschiedene Suchergebnisse angezeigt werden, je nachdem, ob diese zum Beispiel nach medizinischen Informationen oder politischen Informationen suchen.

Wie du mit den Entitäten der Top-Suchergebnisse deine Seite optimierst

Nehmen wir als Beispiel eine Seite der Süddeutschen Zeitung, die momentan auf Seite 18 bei Google für das Keyword “Ist Cannabis gesund” rankt:

Ein Beispielartikel von der Süddeutschen Zeitung, der aufgrund seiner geringen Expertise sehr niedrig bei Google rankt.

Was müssten wir als Süddeutsche Zeitung nun machen, um das Ranking für dieses Keyword zu verbessern?

1) Zuerst schauen wir, welche und wie viele Entitäten mit der Google Cloud Natural Language API in unserem Text erkennen können.

2) Dann machen wir das Gleiche mit den Top 10 Suchergebnissen, die für das Keyword „Ist Cannabis gesund“ ranken.

3) Dann vergleichen wir, welche Entitäten am häufigsten in den Texten der Top 10 Suchergebnisse erkannt werden und NICHT in unserem Text.

4) Diese Entitäten bauen wir dann in unseren Text eine, indem wir den Artikel thematisch ausbauen.

Kein Keyword Stuffing betreiben!

Wie Eingangs erwähnt, erkennt Google auch den Kontext, in dem die Entitäten verändert werden. Würdest du also nur zusammenhanglos Begriffe auf deine Seite hinzufügen, würde dies Google vermutlich als Spam erkennen und die Seite entsprechend abstrafen (mehr zu Keyword Stuffing). Stattdessen solltest du die Entitäten deiner Konkurrenz nutzen, um deinen Inhalt mit diesen Themen zu erweitern und auszubauen.

Für das technische Durchführen kannst du ein Google Sheet verwenden, bei dem du die erkannten Entitäten für jede einzelne Seite in eine Spalte kopierst.

Sortiere dann nach den Entitäten, die am häufigsten im gesamten Sheet vorkommen und schau, ob diese Entitäten auf deiner Seite ebenfalls erkannt werden.

Für den Vergleich verwende ich das SEO-Tool Page Optimizer Pro, welches das beschriebene Vorgehen für mich automatisiert. Hier habe ich die Seite der Süddeutschen Zeitung verwendet und mit den Top 10 Ergebnissen verglichen, die auf Google für das Keyword “ist cannabis gesund” ranken:

Ein Beispiel für einen Report der „Common Entities“ in dem Tool Page Optimizer Pro.

Erklärung des Reports: Grün sind Entitäten, die auf der Seite der Süddeutschen Zeitung erkannt wurden. Rot sind Entitäten, die nicht auf der Seite der Süddeutschen Zeitung erkannt wurden. Die Zahl beschreibt, bei wie vielen der Top 10 Suchergebnisse von Google die jeweilige Entität erkannt wurde.

Wie du sehen kannst, wurden auf der Seite der Süddeutschen Zeitung im Gegensatz zur Konkurrenz viele Entitäten nicht erkannt. Hier müsste man den Artikel verlängern und vor allem die Entitäten (INHALTLICH!) einbauen, die bei der Mehrheit der Top-Suchergebnisse von Google erkannt wurden.

Welche Rolle spielt die Anzahl der Entitäten, die auf einer Seite erkannt werden?

Mit dem Tool Page Optimizer Pro kannst du dir im Menüpunkt Content Brief auch die Häufigkeit anzeigen lassen, mit der die einzelnen Google NLP Keywords auf den Seiten deiner Konkurrenten verwendet werden:

Ein Beispiel für die Google NLP Keywords in dem Content Brief von Page Optimizer Pro.

Die genaue Häufigkeit, in der du einzelne Wörter verwendest, spielt für SEO kaum eine Rolle – Jedoch sind große Unterschiede in der Häufigkeit von erkannten Entitäten entscheidend: 

Verwenden die Top-Suchergebnisse auf Ihren Seiten zum Beispiel im Durchschnitt 60-mal das Wort “Sucht”, deutet dies darauf hin, dass Google mehr Inhalte zu diesem Thema auf der Seite belohnt. Kommt das Wort auf deiner Seite nur 5-mal vor, lohnt es sich dieses Thema inhaltlich auszubauen, sodass mehr Entitäten, die mit dem Thema verwandt sind, in dem Text erkannt werden können.

Versuche bei der Optimierung von Seiten immer möglichst in dem Bereich zu liegen, den Google belohnt. Verwenden zum Beispiel die Top 10 Suchergebnisse das Wort “Sucht” zwischen 40 und 80 Mal, sollte die Anzahl auf deiner Seite nicht stark darüber oder darunter liegen.

Wichtiger ist jedoch die gesamte Anzahl der erkannten relevanten Entitäten auf deiner Seite. Versuche hier in dem Bereich zu liegen, wie die Top 10 Suchergebnisse. Hierfür kannst du ebenfalls das SEO-Onpage-Tool Page Optimizer Pro verwenden.

Nicht Äpfel mit Birnen vergleichen!

Befinden sich verschiedene Typen von Seiten in den Top 10 von Google, solltest du deine Seite nur mit den Seiten vergleichen, welche demselben Typ entsprechen. Willst du also mit einem Artikel ranken, vergleiche dich mit den am höchsten rankenden Artikeln für das Keyword. Willst du mit einer Produktseite ranken, vergleiche dich mit den am höchsten rankenden Produktseiten.

Welche Optimierungen sollten zusätzlich vorgenommen werden?

Beachte auch, dass du die wichtigsten SEO-Basics für einzelne Seiten beachtest, um möglichst schnell erfolgreich mit deinen Seiten zu ranken:

  • Es sollte immer eine Keywordrecherche für jede einzelne Seite durchgeführt werden, um Suchanfragen und häufige Fragen deiner Zielgruppe zu finden.
  • Das Main Keyword für das du ranken willst, sollte sich im Titel, der H1 der URL und im Text (Paragraf) von der jeweiligen Seite befinden.
  • Für wichtige sekundäre Keywords sollten eigene Abschnitte im Text erstellt werden, in welche die wichtigsten sekundären Keywords in der HTML-Überschrift und im Inhalt eingebaut werden.
  • Verlinke mindestens von einer internen Seite zu der optimierten Seite und baue das Main Keyword der Zielseite in den Ankertext (Linktext) ein.

Das Wichtigste ist eine ganzheitliche SEO-Strategie!

Alle Informationen in diesem Artikel haben sich auf die Optimierung von einzelnen Seiten bezogen. Doch selbst wenn du einzelne Seiten bis in das kleinste Detail optimierst, kannst du mit einer schlechten Contentstrategie scheitern. Fehlende Planung deiner Inhalte führt in der Regel zu einem der folgenden beiden Probleme:

  • Die Themen, die auf den einzelnen Seiten behandelt werden, unterscheiden sich zu stark. Dadurch verlierst du gegen Konkurrenten, die in einem Thema spezialisiert sind, da deine Website im Vergleich eine geringere thematische Autorität besitzt.
  • Die Themen, die auf den einzelnen Seiten behandelt werden, sind zu ähnlich. Sodass zum Beispiel zwei Seiten auf deiner Website die gleiche Suchintention beantworten und für ähnliche Keywords ranken (Keyword-Kannibalisierung). Hierdurch kommt es ebenfalls zu schlechteren Rankings.

Führe zunächst eine detaillierte Keywordrecherche durch und erstelle einen Contentplan, der dafür sorgt, dass du sämtliche Suchanfragen zu einem Thema abdeckst, ohne dass es zu größeren inhaltlichen Überschneidungen kommt. Falls du einen SEO-Experten suchst, der dich dabei unterstützt, kannst du mir hier eine Nachricht schicken:

Häufige Fragen

Google Entitäten sind eindeutig bestimmbare Dinge, die im Google Knowledge Graph mit einer eindeutigen Kennnummer abgespeichert sind. Von LSI Keywords wird dagegen gesprochen, wenn es um die kontextuell relevante Begriffe geht. Wäre das Main Keyword Küche, wären Kühlschrank, Herd, Küchenzeile, etc. LSI Keywords. Durch die Verwendung von kontextuell verwandten Begriffen in Texten fällt es Suchmaschinen leichter, Texte besser zu verstehen und den richtigen Suchanfragen zuzuordnen. LSI Keywords sind somit im Gegensatz zu Entitäten nicht eindeutig definierbar, können jedoch dabei helfen, die Relevanz von Texten zu erhöhen.

Ich bin Autor dieses Blogs und arbeite als SEO Experte für Unternehmen in Deutschland, Österreich und der Schweiz. Schreibe jetzt deine Nachricht in die Kommentarbox, wenn du Fragen zu der Google Cloud Natural Language API hast!

Kommentar verfassen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

Cookie Consent Banner von Real Cookie Banner