Suchfibel / Die Kunst des SuchensPhrasensuche

Phrasensuche

Manche Begriffe lassen sich nicht in ein einziges Wort fassen. Eine Person beispielsweise hat Vor- und Nachnamen. Beide Informationen sind wichtig, wenn wir die Telefonnummer erfragen, es sei denn, der Name ist absolut ungewöhnlich. Auch andere Begriffe wie "Bundesrepublik Deutschland" oder "französische Küche" werden erst in der Wortkombination eindeutig.

Solche zusammengesetzten Worte werden in der Suchabfrage als Phrasen bezeichnet. Meist werden sie mit Anführungszeichen " " verknüpft, seltener mit Klammern. Diese Phrasen werden von den Suchmaschinen wie einzelne Worte behandelt. Gesucht wird also nicht nach dem Wort "französisch" und getrennt nach dem Wort "Küche", sondern nur nach dem (zusammengesetzten) Wort "französische[LEERZEICHEN]Küche".

Phrasen können genauso wie alle anderen Worte mit logischen Suchoperatoren im Suchstring verknüpft werden. Sie werden dabei wie ein einziges Wort behandelt.

Welche Maschine nun mit welchen Zeichen zur Kennzeichnung einer Phrase arbeitet, können Sie im Kapitel: Vergleich der Bediensyntax nachlesen.

Die Abk. von Abk. ist Abk.

Eine Abkürzung ist mehr als der Weg durchs Gestrüpp, der zwar einen Kilometer Fußmarsch spart, dafür aber matschige Socken zur Folge hat.

So gesehen könnte man sämtliche Worte, also alles, was man in Sprache ausdrücken kann, als ein einsames Sternchen schreiben. Das spart ganz schön Platz, nicht wahr?

Die Suchmaschinen benutzen meist den Asterisk, auch Sternchen oder Wildcard * genannt, als Platzhalter für beliebige Buchstaben. Die Profis nennen das Folgende Trunkierung, und es eröffnet ungeahnte Möglichkeiten.

Ein Wildcard steht für eine beliebige Anzahl beliebiger Zeichen. Benutzt man den Wildcard am Wortende, so kann nach Begriffen gesucht werden, die beliebige Endungen haben. Bei der Eingabe von Auto* wird beispielsweise nach Automobil, Automation, Automatismus, Autoreisezug und nach wer weiß noch gesucht. Sie sehen, der Einsatz dieser Möglichkeit will wohlüberlegt sein, wenn man nicht in der Ergebnisflut ertrinken will. Wildcards lassen sich auch elegant einsetzen, um nach verschiedenen Schreibweisen eines Fachbegriffes gleichzeitig zu suchen. Gra*ik sucht nach Graphik und Grafik zugleich. Prinzipiell können Wildcards auch am Wortanfang eingesetzt werden; manche Suchmaschinen verbieten dieses aber aus programmtechnischen Gründen. AltaVista beispielsweise sucht nur nach Worten, die mindestens drei Buchstaben haben. Dementsprechend darf der Wildcard frühestens an vierter Stelle im Wort stehen.

Leere Worte

Manche Worte werden von den Suchmaschinen schlicht und einfach ignoriert. Grund hierfür ist das häufige und unspezifische Vorkommen. Solche Worte werden Stopwords genannt. Sie können nur als Teil einer Phrase gesucht (und gefunden) werden. Beispiele sind Artikel, Präpositionen: der, das, er, sie, ein, eine und die englischen und anderssprachigen Entsprechungen.

Dazu kommen je nach Maschine weitere spezifische Stopwords. Nach UND, ODER, AND und den anderen Boole´schen Operatoren kann nicht gesucht werden, da sie eben als Operatoren verwendet werden. Manche Maschinen suchen nicht nach Worten, die drei oder weniger Buchstaben haben, andere schließen spezielle Zeichen aus: +, -, da auch diese als Steuerzeichen im Suchstring verwendet werden. Auch Zahlen oder spezielle Zeichen, die im Programmablauf verwendet werden, wie $ oder &, werden automatisch ignoriert.

Man kann seine Suche noch besser und feiner formulieren mit der Feldsuche.


Phrasensuche hat nicht mit dem so genannten Phrasen dreschen zu tun. Das ist der Job von Politikern...