PDF-Dokumente gezielt suchen – Google Document Search

Wer blickt schon noch im Index der Google-Suche durch. Man gibt einen Begriff oder eine Wortgruppe ein und bekommt ewig viele Resultate. Es mag ja sein, dass die ersten paar davon eine gewisse Relevanz haben. Doch qualitativ hochwertig müssen die Inhalte deswegen noch lange nicht sein.

Während der Arbeit an meiner Magisterarbeit hab ich spezielle Suchbefehle zu schätzen gelernt, mit denen gezielt nach Dateitypen gesucht werden kann. Das ganze funktioniert mit dieser Befehlszeile: „filetype:pdf keyword“. Die Suchmaschine spuckt dann alle PDF-Dokumente aus, in denen das genannte Keyword vorkommt. Das funktioniert natürlich auch mit Word-Dokumenten oder anderen Formaten.

Wer sich die Arbeit, immer wieder den Befehl einzugeben, sparen möchte, dem kann ein nettes Tool weiterhelfen. Die Google Document Search bietet die Möglichkeit, nach vielen verschiedenen Dateitypen zu suchen. Es wird zwar nur der Index von Google.com durchsucht, die Ergebnisse sollten aber auch für deutsche Stichwörter recht interessant sein.

Kurze Suchanfragen bringen weniger Qualität – neue Suchtrends

Suchanfragen mit einem oder zwei Suchbegriffen dominieren nach wie vor. Wer nach allgemeinen Informationen sucht, der wird einen Begriff in der Google-Suche eingeben und dabei vor allem die ersten 3 Ergebnisse berücksichtigen. Aus diesem Grund bemühen sich viele Suchmaschinenoptimierer, ihre Seiten für umkämpfte Einzelbegriffe nach vorn zu bringen.

In letzter Zeit zeichnet sich aber eine Verschiebung der Suchtrends ab. Immer mehr Informationshungrige geben detailliertere Suchanfragen ein. Anfragen mit vier und mehr Wörtern sind keine Seltenheit. Der Grund dafür kann in der mangelnden Qualität liegen, die die Ergebnisse bei Ein- und Zweiwortabfragen hervorbringen.  Spezifischere Suchanfragen scheinen also bessere Ergebnisse zu garantieren.

Diese veränderten Suchtrend sind sicherlich ein Grund, warum immer mehr Suchmaschinenoptimierer auf Keywordkombinationen und den Long Tail setzen. Wenn die Unterseiten auf bestimmte Keywordkombis optimiert werden, dann bringt das ein sehr interessantes Publikum auf die eigenen Projekte.

Man kann davon ausgehen, dass spezifischere Suchanfragen mit interessierteren Besuchern einhergehen. Also nicht mehr auf  „Kredit“ optimieren, sondern auf „student kredit sicherheiten“?

Semantische Daten in Google Suchergebnissen

Bislang kann Google Webseiten nur anhand einer Textanalyse kategoriesieren. Dabei werden vorhandene Wörter oder Wortgruppen ausgelesen und anhand der Häufigkeit, oder der Position, an der sie erscheinen, bewertet. Die Ergebnislisten stellen sich dann aus diesen Wörtern zusammen und die Website wird eher nicht erscheinen, wenn nach einem Synonym oder einer Umschreibung gesucht wird.

Es gibt Bestrebungen, die Suche intelligenter zu machen. Im Resultat könnte Google dann in der Ergebnisliste die Antwort auf eine direkt gestellte Frage geben. Das würde auch dann funktionieren, wenn die Keywords, die in der Frage vorkommen, nicht auf den angezeigten Ergebnisseiten erscheinen. Mit semantischen Analyseverfahren würde der Google-Spider erkennen, dass es sich hier um verwandte Begriffe handelt oder sogar um die bestmögliche Lösung auf die gestellte Frage.

Bis heute sind solche Bestrebungen noch nicht effektiv umgesetzt wurden. Es gab Versuche, neue semantische Suchmaschinen zu etablieren und so Google zu attakieren. Ein Beispiel ist Semager. Hier sollen verwandte Wörter und Webseiten mit ähnlichen Sinninhalten aufgespürt werden können.

Auch in den Google-Suchergebnissen scheinen neuerdings semantische Daten verarbeitet zu werden. Das folgende Bild zeigt, was angezeigt wird, wenn man nach der Hauptstadt von Thüringen fragt.

semantik-google

Wie leicht zu erkennen ist, erscheint an erster Stelle die Antwort auf die gestellte Frage. Die weiteren Ergebnisse werden wieder anhand der Häufigkeiten von Keywords bestimmt. Nicht umsonst erscheint im Beschreibungstext des zweiten Ergebnisses die eingegebene Zeile „Hauptstadt von Thüringen“. So funktioniert die Google-Suche ja auch bislang. Die relevantesten Seiten sind die, auf denen das Keyword in nahezu der gleichen Form vorkommt (off-page-Faktoren sollen einmal ausser Acht gelassen werden).

Ist das also ein erster Schritt in Richting semantischer Google-Suche? Dann würde mich interessieren, wie die klassische Suchmaschinenoptimierung hier angreifen soll?