Suchfibel
/
Suchmaschinen Software
/ Serversoftware
/ Freie Software
Freie Software
Matt Wrights Script Archive ist eine der bekanntesten Adressen im Netz, wenn es um freie Perl-Scripts
geht. Matts Suchmaschine erfordert einige Programmierkenntnisse bei der Installation und durchsucht HTML-Seiten im Filesystem bestimmter Serververzeichnisse im Volltext.
Die Konfiguration erfordert mehr als nur oberflächliche Kenntnisse in Perl. Das Script ist recht flott und geeignet für kleine bis mittlere Sites.
Gamelan ist wie schon erwähnt die Quelle für Java-basierte Suchmaschinen.
Excite for Web Servers ist ein ca. 2MB großes Paket für die gebräuchlichsten Serverbetriebssysteme. Leicht
zu installieren erlaubt die Software Volltext- und Konzeptsuche, bei der automatisch Zusammenfassungen der Seiten erstellt werden.
freeWAIS-sf ist eine populäre Software für die meisten Unix-Betriebssysteme. Die Software erlaubt
die Verknüpfung von Suchbegriffen mit Boole´schen Operatoren. Es existieren verschiedene Newsgroups, wo man sich über Installation, Konfiguration und Weiterentwicklung
informieren kann.
GlimpseHTTP läuft auf etlichen Hundert Servern weltweit. Der generierte Index hat lediglich 3 - 5% der Größe
der indexierten Dokumente. Die Software ist (nur) für nichtkommerziellen Einsatz frei erhältlich. Wie viele der frei erhältlichen Suchsoftwares wurde Glimpse an einer
amerikanischen Hochschule entwickelt, an der Universität von Arizona.
Webglimpse ist eine erweiterte Version von Glimpse. Mit Webglimpse ist es möglich auch Dokumente
außerhalb des eigenen Servers dem Index zuzufügen.
SWISH (Simple Web Indexing System for Humans) ist eine verbreitete Software für Unix, die in der
Lage ist, einen sehr kleinen Index zu erstellen.
SWISH-E (SWISH Enhanced) ist die verbesserte Version. Die Suche kann auf einzelne Seitenelemente
wie Überschriften und Meta-Tags beschränkt werden. Auch stehen Boole´sche Operatoren und Wildcards zur Verfügung.
Thunderstone Webinator ist für so gut wie alle ernst zu nehmenden Serverbetriebssysteme zu haben.
Die Freeware-Version ist auf 10.000 Seiten beschränkt, die kommerzielle Version kann unbegrenzt viele Webseiten indexieren. Der Robot kann auch externe Seiten erfassen.
Die Konfigurationsmöglichkeiten sind umfassend; Boole´sche Verknüpfungen sind ebenso möglich wie Fuzzy-Suche und Sortierung der Treffer nach Relevanz.
Harvest wurde an der Universität von Colorado entwickelt und ist eines der ersten Robotersysteme.
ht://DIG
ht://Dig kann im Unterschied zu anderen Suchsoftwares Websites auf verschiedenen Servern durchsuchen. Das Programm ist für kleinere Domains oder Intranets gedacht,
erlaubt auch die Suche im Filesystem und in PDF Dateien. Die Meta-Tags description und robots werden unterstützt. Die Software wurde an der San Diego State University
entwickelt und wird unter der
GNU General Public License
verbreitet. XXX hat ht://dig mit Netscapes Webcompass Server verglichen.
|