Berichte eines Anfängers:
Wie arbeiten Suchmaschinen

Populäre Suchmaschinen haben sich ins WWW so reibungslos integriert wie keine andere Sache. Hier soll halb spekulativ halb mit technischem Wissen die Arbeitsweise einer Suchmaschine durchleuchtet werden. Spekulativ deswegen, weil eigentlich keiner genau weiss was eine Suchmaschine macht. Hinzu kommt daß Suchmaschinenprogrammierer immer bemüht sind ihr Konzept zu verbessern. Die meisten Suchmaschinen die ich kenne haben in den letzten Jahren am äußeren Erscheinungsbild und an der Bedienbarkeit gearbeitet.

Eine Suchmaschine beruht eigentlich auf folgendem Prinzip:
  • User gibt Daten über WWW ein
  • Suchmaschinenrechner durchsucht einen Datensatz lokal
  • Suchmaschine gibt eine Ausgabe über WWW aus

    Im simpelsten Fall haben wir eine WWW Seite mit einem Eingabefeld. Dann noch ein Skript welches die Dateneingabe filtert, z. B. mit sed und einen Datensatz durchsucht, z. B. mit grep. Es muss nicht unbedingt ein Datenbanksystem sein, es reicht wenn ein paar Textdateien oder HTML Dateien vorliegen und grep sucht in diesen nach einem Begriff, wird der Begriff gefunden, so gibt die HTML Seite die jeweilige Zeile aus und nebenbei auch noch einen Link auf die Datei in welcher der Begriff gefunden wurde.

    Wenn man sich mit CGI Programmierung auskennt ist dies keine allzu schwierige Aufgabe. Jedoch kann ich mir trotzdem vorstellen dass bei den meisten Suchmaschinen ein(e) Programmierer(in) täglich an dem Suchlauf und an der Bedienung arbeitet, auch wenn der Datenstamm vorhanden ist bzw. automatisch generiert wird.
  •