Suchfibel / Die Kunst des SuchensBoole´sche Operatoren

Boole´sche Operatoren

Bisher war es ja noch relativ simpel. Dummerweise besteht die Welt aber aus mehr als Brot und Füllfederhaltern. Das haben Sie bestimmt schon bemerkt. Die Möglichkeiten der Suchmaschinen jedenfalls tragen dem Rechnung.

Was also, wenn ich keine Kümmelbrote mag oder grüne Tinte ganz scheußlich finde? Der Auftrag an den Einkäufer würde dann lauten: "Bring mir Brot, aber bloß keins mit Kümmel drin." Sowas lässt sich auch mit Operatoren formulieren: Brot ja, Kümmel nein, wird zu: Brot NICHT Kümmel. Sicher fällt es Ihnen leicht, analog dazu eine Suche zu formulieren, die grüne Tinte ausschließt?

George Boole hat diese Algebra entwickelt. Er ist also schuld, wenn Sie immer wieder von Boole´schen Suchoperatoren lesen. Wie Sie sehen, ist das aber gar nicht so verzwickt, wie es auf den ersten Blick scheint. Spannend wird es, wenn es mehrere Begriffe gibt, die sich lustig verknüpfen lassen. Bleiben wir beim Brot und berücksichtigen jetzt wieder die Getreidesorte. Brot soll sein, Weizen oder Roggen ist egal, aber bloß kein Kümmel. Erster Versuch:

Brot UND Weizen ODER Roggen NICHT Kümmel

Könnte man meinen. Stimmt leider nicht ganz, denn die Suche erfolgt der Reihe nach. Also: Brot UND Weizen sind bei dieser Formulierung verknüpft, müssen also, wie wir einen Absatz weiter oben festgestellt haben, beide vorkommen. Wir wollen aber die Option Weizen oder Roggen offenhalten. Daher muss auch der Suchmaschine diese Absicht klar gemacht werden. Das geht, indem die beiden Begriffe Weizen und Roggen zusammengefasst werden, ganz wie in der Mathematik: Die Eingabe lautet also:

Brot UND (Weizen ODER Roggen) NICHT Kümmel

Das kann man noch viel weitertreiben. Wichtig ist nur, dass Sie die richtigen Begriffe mit den entsprechenden Operatoren und Klammern verbinden. Zum Probieren: Ich möchte einen Füller mit Tintenfass oder Tintenpatronen, aber keine grüne Tinte, und auch keine lila Tinte. Wenn Ihnen das noch nicht reicht, will ich zickigerweise nur einen Füller mit Goldfeder. So.

Das gesamte Gebilde, das bei der Sucheingabe eingetippt wird und die Suchmaschine steuert, heißt übrigens Suchstring.

Andere Länder, andere Sprachen. Auch das wissen Sie und so wird es Sie nicht überraschen, dass das mit dem UND woanders auch anders heißt. In der Tat werden die meisten Boole´schen Operatoren englisch eingegeben und in Großbuchstaben, um sie von normalen Wörtern zu unterscheiden.

Deutsch Englisch
UND AND
ODER OR
NICHT NOT

Plus und Minus

Ein klein wenig Mathematik hatten wir schon bei den Klammern, mit denen sich Suchbegriffe logisch miteinander verknüpfen lassen. Jetzt kommen mit der Modal-Logik noch mehr Möglichkeiten ins Spiel. Keine Sorge, es wird dadurch nicht komplizierter. Versuchen wir mal, den oben schon verwendeten Suchstring mit mathematischen Zeichen zu formulieren. Die Aufgabe war: "Bring mir Brot, aber bloß keins mit Kümmel drin". Der Suchstring heißt dann:

+Brot -Kümmel

Brot muss sein, Kümmel darf nicht sein. Beachten Sie, dass zwischen dem vorangestellten Zeichen und dem Suchbegriff kein Leerzeichen steht, wohl aber zwischen den Worten. Das ist wichtig.

Wenn die Getreidesorten wieder mit ins Spiel kommen, lautet der Suchstring bei der bekannten Fragestellung: "Brot soll sein, Weizen oder Roggen ist egal, aber bloß kein Kümmel":

+Brot +(Roggen Weizen) -Kümmel

Begriffe, die enthalten sein können (Roggen, Weizen), bekommen kein zusätzliches Zeichen vorangestellt. Wieder müssen die Klammern herhalten. Ohne diese wären die beiden Begriffe Roggen und Weizen gänzlich optional und könnten daher auch unberücksichtigt bleiben. Im Extremfall wäre das Ergebnis dasselbe wie beim ersten Beispiel. Erst die Klammer mit dem vorangestellten Pluszeichen macht aus der Option eine Auswahl zwischen beiden Begriffen, die ihrerseits enthalten sein muss.

Freundliche Nachbarn

Fehlt noch ein Operator, der sich leider nicht durch solch schöne bunte Vergleiche erläutern lässt. Ist auch gar nicht nötig, denn er ist sehr einfach zu verstehen. Der Operator heißt NEAR und jeder, der ein bisschen Englisch spricht, weiß jetzt, dass mit NEAR verknüpfte Worte in einem bestimmten Abstand voneinander im Dokument vorkommen müssen. Diese Funktion ist nicht mit der Phrase zu verwechseln, bei der die Worte unmittelbar aufeinander folgen müssen. Bei der NEAR-Verknüpfung dürfen zwischen den Begriffen auch andere Worte stehen. Wie viele das genau sein dürfen, das ist bei jeder Suchmaschine anders. Die Zahlen schwanken zwischen 10 und 200 Worten.

An der Stelle gibt es noch den Fachbegriff der Proximity: Bei Mehrwortsuchen, die ohne Boole´schen Operator ausgeführt werden, versucht sie Suchmaschine, solche Treffer zu finden, bei denen die gesuchten Begriffe möglichst nah beisammen stehen. Klar, denn je länger das Dokument, desto großer die Gefahr, dass jeder Begriff für sich in ganz anderem Zusammenhang steht und die beiden Begriffe nichts miteinander zu tun haben. Moderne Suchmaschinen suchen automatisch mit dem NEAR Operator und nennen den Rankingfaktor Proximity.

Um sicherzustellen, dass bei einer Suche mehrere Wörter ganz exakt nebeneinander stehen, kann man die Phrasensuche verwenden.


Der Mathematiker George Boole., 1815 in England geboren, wurde mit seinem Werk The Mathematical Analysis of Logic bekannt. Diese Publikation demonstrierte erstmals, dass sich die Aristotelische Logik als algebraische Strukturen darstellen lässt. Boole: "Wir sollten nicht länger Logik und Metaphysik, sondern Logik und Mathematik miteinander verbinden."