Der Index der Suchmaschinen

Wenn Sie verstehen wie die Suchmaschine arbeitet - können Sie Ihre Inhalte adäquat und für die Suchmaschine relevant aufbereiten.

Was ist der Index genau?

Der Index der Suchmaschine beinhaltet alle bisher bekannten und von der Suchmaschine selbst verarbeiteten Seiten. Verarbeitet bedeutet hier, daß die Suchmaschine die betreffende Seite gefunden, „gelesen“ und die Kerninformation der Seite dauerhaft gespeichert hat.
Sämtliche Inhalte, die die Suchmaschine bisher gesammelt hat und in der Zukunft noch sammeln wird, findet hier sauber sortiert und verschlagwortet seinen Platz.
Wenn wir über den Index sprechen, dann ist eine enorme Datenbank gemeint, die täglich aktualisiert wird.

Am einfachsten lässt sich der Index mit einem Archiv eines großen Museums vergleichen.
Der Archivar legt fein säuberlich jedwede relevante Information, die von Ihren Mitarbeitern oder von externen Wissenschaftlern an das Museum weitergegeben werden in einem logischen Konzept ab.
Die Hauptaufgabe eines solchen Archivs besteht darin, jede Information, sei sie noch so alt oder zum Zeitpunkt der Ablage scheinbar unbedeutend, mit wenig Aufwand auffindbar zu machen und wiederherzustellen.
Sicherlich kennen Sie das Problem aus Ihrer alltäglichen Praxis – Dokumente müssen sinnvoll in Aktenordnern archiviert werden, damit sie auch Jahre später noch auffindbar und wiederverwendbar sind.

Die Suchmaschinen basieren auf genau diesem System. Jede Information die ein Crawler der Suchmaschine beim „Lesevorgang“ erfasst und an die Suchmaschine selbst sendet, wird im Kontext der dazugehörenden Seite gespeichert – sie wird indexiert.
Neben den individuellen Bewertungsalgorithmen der Suchmaschine stellt der Index das Herzstück jeder Suchmaschine dar und wird unter strengsten Sicherheitsvorkehrungen geschützt.

Die Verschlagwortung – Das „Tagging“

Sobald der Crawler Ihre Internetseite „betritt“ beginnt er anhand des HTML Quellcodes den Inhalt zu „lesen“.
Er erfasst Überschriften, Fliesstext, Linktexte, Titel und Altattribute von Bildern neben einer Vielzahl von weiteren Informationen.
Diese Informationen werden zur weiteren Verarbeitung zurück an die Suchmaschine übermittelt. Der Crawler selbst verarbeitet keine Daten – er erfasst lediglich und sendet alle Informationen zurück an die Suchmaschine. Diese beginnt nun den Inhalt zu analysieren, indem die verschiedenen übermittelten Informationen in einen Bezug gesetzt werden. Die Suchmaschine versucht die Kerninformation der vorliegenden Seite zu erfassen. Dabei stellt sie sich in etwa folgende Fragen:

  • Welches sind die Hauptkeywords?
  • Bestehen auf den weiteren Seiten Ihrer Domain zusätzliche Informationen zu den Hauptkeywords?
  • Auf welcher Ihrer einzelnen Seiten sind tiefergehende Inhalte, ggfs. Erklärungen oder Erläuterungen vorhanden?

Die Verschlagwortung an einem Beispiel

Jedes einzelne, vom Crawler gemeldete Dokument einschliesslich PDF Dateien, wird wie vorangehend untersucht und verschlagwortet.
Stellen Sie sich vor, Sie würden Bilderrahmen über Ihre Webseite verkaufen.
Der Crawler meldet nun zunächst, dass auf der Startseite Ihrer Domain generelle Informationen zum Thema Bilderrahmen stehen. Dies kann u.a. daraus erschlossen werden, dass der Text auf der Startseite das Keyword Bilderrahmen mehrfach nennt.
Dazu nimmt der Crawler wahr, dass die Navigationsstruktur Ihrer Seite jeweils einen Link auf folgende (Unter-)Seiten enthält:

  • Bilderrahmen aus Holz
  • Bilderrahmen aus Metall

*Hinweis: Der besseren Lesbarkeit wegen beschränken wir uns an dieser Stelle auf lediglich zwei mögliche Kategorien.

Auf der jeweiligen Seite, auf die die Links verweisen, findet der Crawler nun diverse weitere Informationen zu Holzbilderrahmen bzw. Metallbilderrahmen und meldet selbstverständlich auch das zurück an die Suchmaschine.
Aufgrund der eigenen Erfahrungen der Suchdienste können diese nun erkennen, dass die Seite Permutationen zu den Keywords enthält – Bilderrahmen aus Holz und Holzbilderrahmen bezeichnen ein und dieselbe Produktgruppe und können auch so durch die Suchmaschinen weiter verarbeitet werden.

Aller Wahrscheinlichkeit nach wird Ihre Seite also einen Eintrag im Index der Suchmaschine unter folgenden Keywords bekommen:

  • Bilderrahmen
  • Bilderrahmen aus Holz
  • Holzbilderrahmen
  • Bilderrahmen aus Metall
  • Metallbilderrahmen

Die Ergebnisliste der Suchmaschine

Nachdem Ihre Seite nun einen Eintrag im Index der Suchdienste erhalten hat, sehen wir uns diesen Eintrag einmal genauer an.
Ihre Webseite ist unter den oben genannten Begriffen verschlagwortet worden, sollte also ein Nutzer eines dieser Keywords in den Suchschlitz eingeben, wird die Suchmaschine Ihre indexierte Seite mit denen Ihrer Konkurrenten vergleichen.
Beispielsweise wird eine Internetseite relevanter bewertet, wenn das gesuchte Keyword in Überschrift, Linktext und Fliesstext vorkommt als wenn es nur im Fliesstext gefunden worden ist.

Die Position innerhalb der Ergebnislisten wird also nach Relevanz vorgenommen. Derjenige, der das eingegebene Keyword am besten für die Maschine aufbereitet hat, wird über den anderen stehen.
Die einzelnen Kriterien dieses Bewertungsvorgangs sind geheim, langjährig tätige Agenturen oder erfolgreiche Suchmaschinenoptimierer können aus einem Erfahrungsschatz die Kriterien auswählen, die in der Vergangenheit schoneinmal einen positiven Effekt erzielt haben.
Suchmaschinenoptimierung ist im Grunde nichts anderes, als die Inhalte der Webseite so zu verarbeiten, daß sie für die Suchmaschine eindeutig erschliessbar sind.
Sofern dies gelungen ist, beinhaltet die Arbeit eines seo`s noch das aufwerten der einzelnen Keywords innerhalb der Webseite. Dies ist zumeist sehr technisch und oft für den Laien unverständlich.

Kommt jede Seite in den Index der Suchdienste?

Diese Frage kann mit einem klaren NEIN beantwortet werden.
Da die Suchdienste im klassischen Sinne freie Dienstleister sind, bestimmen sie selbst welche Seite aufgenommen wird und welche nicht.

Gibt es ein Recht auf einen Eintrag im Index der Suchmaschine?

Auch hier gilt ein klares NEIN. Wie oben schon erläutert, haben wir es mit einem Dienstleister zu tun, der seine Bewertungen völlig Eigen regeln und bestimmen kann.
Auch eine Webseite, die schon im Index war oder ist kann durchaus in der Zukunft komplett ausgeschlossen werden.
Dies kommt zwar öffentlichwirksam recht selten vor, aber die Entscheidung darüber liegt allein bei der jeweiligen Suchmaschine.

Einige Suchmaschinen veröffentlichen „Verhaltensregeln“ für Webseitenbetreiber und Suchmaschinenoptimierer gleichermaßen, die bei Befolgung eine Indexierung vereinfachen, evtl. auch beschleunigen können.
Aber auch Webseiten die sich nicht an diesen Codex halten können ebenso aufgenommen werden. Oftmals allerdings erhalten diese Webseiten dann eine schlechtere Bedeutung oder deren Keywords werden generell nicht so wertvoll eingestuft, wie die von solchen Webseiten, die sich strikt an die „Verhaltensregeln“ halten.

Die conversionmedia optimiert Webseiten

Innerhalb der Suchmaschinenoptimierung erheben wir zunächst eine Menge statistischer Daten. Neben den Schlagworten, unter denen die Suchmaschinen Ihre Webseite führt, gehören auch Daten über Fehlermeldungen oder anderer Webseiten, die auf dem gleichen Server gespeichert werden wie Ihre, dazu.

Das Ziel ist zunächst immer, die Keywords für Suchmaschinen relevant zu machen, die zu Ihnen und Ihren Angeboten / Produkten passen.
Erst wenn diese Relevanzbeeinflussung geglückt ist, beginnt die eigentliche Optimierung am Content Ihrer Webseite.

Haben Sie noch Fragen? Dann sprechen Sie uns einfach an.

Dirk Preuten

Dirk ist seit 2008 geschäftsführender Gesellschafter der conversionmedia GmbH & Co. KG, einer Online Marketing Agentur mit Sitz in Dinslaken am Niederrhein. Seit dieser Zeit betreut er auch den Fachbereich Suchmaschinenoptimierung und betreut vor allem die Großkunden der Agentur. Unregelmässig twittert er auch oder beschäftigt facebook & Google+.