Suchmaschinen

 

 

Um den Informationswust des World Wide Web in den Griff zu bekommen begannen im April 1994 David Filo und Jerry Yong, beide Doktoranden an der Universität von Stanford, ihren Suchdienst. Ziel war dabei zunächst, ihre persönlichen Interessen im Internet besser verfolgen zu können. Aus der überquellenden Bookmark- Verzeichnissen wurde ein Katalog von Web Adressen, und aus diesem Katalog entstand der Suchdienst Yahoo. Jetzt im Internet für die Informationssuche stecht eine ganze Reiche von Suchmaschinen zur Verfügung.

 

,,Suchmaschinen " bieten die Möglichkeit, im einer einzigen Abfrage den Inhalt großer Teile des Internet zu durchsuchen. Das Prinzip nach dem die Suchmaschinen arbeiten, klingt relativ einfach: man schickt einen oder mehrere Suchbegriffe an eine Suchmaschine und bekommen als Ergebnis eine Liste mit Verweisen auf Dokumente, in denen diese Suchbegriffe vorkommen. Um das zu ermöglichen, durchkämmen automatisch arbeitende Programme, sogenannte " Robots " oder " Spider ", das WWW ebenso wie einige Internetdienste. Sie laden alle erreichbare Dokumente herunter und speichern sie ganz oder auszugsweise in großen Datenbanken.

 

Die hohen Abrufzahlen, die eine gute Suchmaschine erzielen kann, machen den Aufbau eines solchen Dienstes interessant für die kommerzielle Ausnutzung. Die Mehrzahl der Suchmaschinen wird daher von Firmen mit Gewinnabsicht betrieben, wobei die Nutzung selber im allgemeinen kostenlos ist und der Gewinn durch Werbe und Lizenzeinnahmen erzielt werden soll.

 

Es gibt eine Reihe " etablierter" Suchmaschinen, die sich mit großem Aufwand an Hard- und Software der Sisyphusaufgabe widmen, möglichst vollständige Datenbanken aller im Internet abrufbaren Dokumente zusammen zustellen und zu diesem Zweck rund um die Uhr das gesamte WWW und andere Internetdienste durcharbeiten.

 

Daneben gibt es eine wachsende Anzahl kleinerer Suchmaschinen, die entweder nur Dokumente einer Sprache, eines Fachgebietes oder eines bestimmten Internetdienstes erfassen.

 

Suchmaschinen unterscheiden sich ganz erheblich in der Qualität der Datenbankherstellung. Einige erfassen tatsächlichen den kompletten Text und die Struktur ( zum Beispiel Titel, Überschriften, Verweise und so weiter) der abgerufenen Dokumente, andere indexieren nur Teile des Textes (zum Beispiel nur die ersten Zeilen oder nur die Überschriften) oder sogar nur die URLs.

 

Weitere wichtige Qualitätsunterschiede ergeben sich aus der Aktualität der Datenbanken ( also zum einen aus der Schnelligkeit mit der neu im WWW veröffentlichte Dokumente erfaßt werden und zum anderen wie oft die vorhandenen Einträge aktualisiert werden) und aus dem Komfort der Abfragemöglichkeiten .

 

Alle Suchmaschinen haben ihre Stärken und Schwächen, und keine bietet die perfekte Kombination aus allen wünschenswerten Funktionen. Es kann man nicht verlassen nur auf die Ergebnisse einer einzigen Suchmaschine, denn das Internet zu groß und zu dynamisch ist, als daß eine Suchmaschine tatsächlich alles in ihrer Datenbank erfassen könnte.

 

 

Welche Suchmaschinen sind wichtig ?

 

Keine Suchmaschine unterstützt alle möglichen Suchfunktionen. Deshalb ist das wichtigste Kriterium bei der Auswahl die Unterstützung der benötigten Funktionalität. Wenn man beispielsweise direkt nach einem URL suchen wollen, dann bleibt nur die Wahl zwischen Hobot und Alta Vista , weil nur diese beiden eine direkte URL - Suche unterstützen.

 

Andere Entscheidungskriterien

 

Müßte nicht eigentlich die Größe einer Suchmaschine entscheiden für ihre Nützlichkeit sein? Um es gleich vorwegzunehmen: das ist nicht ganz richtig. Selbst eine kleine Suchmaschine mit nur wenigen Hunderttausend Dokumenten liefert bei entsprechenden Anfragen schon mehr Treffer, als in vertretbarer Zeit auf Brauchbarkeit überprüft kann man.

 

Ohnehin läßt sich eine verläßliche " Größe" nicht bestimmen. Glaubt man dem lautstarken Selbstlob der Suchmaschinenbetreiber, sind sie jeweils die besten, größten und schnellsten. Alta Vista, Hobot, Excite und Lycos geben jeweils um 60 Millionen erfaßte URLs an - aber das sind schwer kontrollierbare Selbsteinschätzungen. Auch was gezählt wird, ist nicht ganz klar. Während Alta Vista , Hobot, Excite die Dokumente inm Volltext, also komplett, erfassen, gilt gei Lycos ein URL schon als erfaßt, wenn er nur in einem anderen Dokument als Hypertexlink auftaucht. Zudem erfaßt Lycos die Dokumente nicht komplett, sondern nur Teile des Textes.

 

Es kommt also vor allem darauf an, daß eine Suchmaschine das liefert, was man sucht. Das kann entweder durch vielfältige Suchmöglichkeiten geschehen oder durch ausgefeilte Relevanzberechnung.

 

Jeder Surfer hat seine Lieblingsmaschine. Die höchsten Zugriffszahlen haben die Suchmaschinen und Kataloge, die über Netscapes Navigator und Microsoft Internet Explorer per Mausklick auf den Programminternen Suchen - Button direkt zu erreichen sind. Das sind:

www.excite.com)

www.lycos.com)

www.yahoo.com)

Zumindestens zu diesen Suchmaschinen sollte man seine Seite anmelden. Wer überall vertreten sein will, aber nicht die Zeit hat, Seine Seiten anzumelden, kann einen der vielen Anmeldedienstleister in Anspruch nehmen, wie beispielsweise WebPromote (http://www.webpromote.com/isuadd.shtml), der gegen Bares eine Webseite bei 200 Suchmaschinen anmeldet.

 

 

Die Möglichkeiten der Suchmaschinen

 

Wie ein Beispiel wird dafür Alta Vista verwendet. Außer dem Texteingabefeld, in das die Suchbegriffe eingetragen werden gibt es bei Alta Vista noch zwei weitere Auswahlmöglichkeiten, mit denen den Einfluß auf die Suche nehmen kann man.In der linken Box kann man vorgeben, ob das WWW oder die Newsgruppen durchsucht werden sollen. In der rechten Box kann man einstellen wie detailliert die Ergebnisse angezeigt werden sollen. Zuerst muß man passendes Suchbegriff überlegen. Man muß möglichst spezifische Stichwörter zu benutzen, um nicht zu viele irrelevante Treffer zu erzielen.

 

 

Schneller Sucherfolg mit Basistechniken

 

Allgemeine Begriffe wie "Musik", "Tiere" oder "Kunst" sind nicht für die Suche in Suchmaschinen geeignet. Darum versucht man statt dessen, Suchbegriffe zu finden, die genau beschreiben, was sucht man.

 

Viele von Suchmaschinen durchsuchen das Internet ohne Rücksicht auf die Sprache der Dokumente oder den geographischen Ort, an dem sie abgelegt sind.

 

Um eine Suchanfrage abzuschicken tragt man zunächst den Suchbegriff in das Texteingabefeld ein. Man soll achten, ob noch zusätzliche Optionen durch Auswahlmenüs oder Ankreuzfelder eingestellt werden können. Dann schickt man die Anfrage ab, indem man auf den entsprechenden Button klicken.

 

Rechtschreibreform

Groß- und Kleinschreibung

 

Die Behandlung der Groß- und Kleinschreibung von Suchbegriffen ist eine der wenigen Gemeinsamkeiten fast aller Suchmaschinen. Merkt man folgende Faustregeln:

Darum verwendet man im allgemeinen die Kleinschreibung, vor allem auch bei englischen Suchbegriffen. Bei Eigennamen, Abkürzungen und Produkten soll man dagegen die Großschreibung verwenden ( z.B. "Photoshop", "ZDF").

Als Ergebnis erholt man die Dokumente, in denen genau diese Wörter vorkommen.

 

Anzeige der Suchergebnisse

 

Alta Vista liefert immer 10 auf einmal. Bei anderen Suchmaschinen läßt sich die Größe dieser Teilmengen einstellen, aber keine Suchmaschine liefert alle Treffer auf einmal. Denn dabei bestünde die Gefahr, daß bei häufig vorkommenden Wörtern die Trefferliste zu lang wird, um noch in vertretbarer Zeit übertragen zu werden.

 

Die Treffer werden anschließend in einer numerierten Übersicht aufgelistet. Alle Ergebnisse sind als unklickbare Links aufgeführt, denn die Suchmaschinen liefern nicht die Dokumente selbst, sondern nur Verweise darauf. Man soll achten auf die Formulierung "best matches first" - damit wird angedeutet, daß Alta Vista versucht, die "besten" Treffer an den Anfang der Liste zu stellen. Auch bei den anderen Suchmaschinen ist die Darstellung der Trefflisten ähnlich aufgebaut.

 

Unterschiede gibt es jedoch bei den Angaben, die zu den gefundenen Dokumenten mitgeliefert werden. In der Abbildung ist zu sehen, daß Alta Vista zu jedem Treffer den Titel, einen Auszug aus dem Text und das Datum, an dem die Datei das letzte Mal geändert wurde, sowie den URL anzeigt. Diese zusätzlichen Angaben helfen aus der Liste der Suchergebnisse die vielversprechendsten auszuwählen.

 

Die Menge der Information sagt aber noch nicht über die Qualität aus. Suchmaschinen, die das ganze Internet durchsuchen, bauen riesige Datenbanken auf, die - je nach Anbieter und Zählweise - über 50 Millionen Dokumente enthalten können. Deshalb produziert eine Anfrage bereits eine relativ große Treffermenge.

 

Wenn man die Zeit nicht mit dem Durchsehen von Hunderten von Treffern vergeuden wollen, muß man die Suchanfrage so präsentieren, daß die Anzahl der Treffer auf ein vernünftiges Maß heruntergeschraubt wird. Zu diesem Zweck gibt es bei allen Suchmaschinen die Möglichkeit Die Anfragen genau zu formulieren und weitere Stichwörter oder zusätzliche Suchkriterien einzugeben.

 

Wie die Suchmaschinen funktionieren und welche Grenzen sie haben

Was kann man von Suchmaschinen erwarten und was nicht

 

 

Der Aufbau von Suchmaschinen basiert auf drei Grundtechniken: Diese sind das Indexing ( der Versuch, alle Seiten auf alle Sites zu indizieren), die Categorizer (die Informationen über Inhaltsverzeichnisse zu steuern) und die Reviewers ( das Bewerten und Kategorisieren von Informationen).

 

Indexieren

Wenn globale Informationen im Internet gesucht werden, bei denen man selber nicht sehr genau definieren kann, was wirklich gesucht wird, bieten sich die Indexierer an. Durch anschließende Verfeinerung der Abfrage wird die Auswahl weiter eingeschränkt, bis eine übersichtliche Anzahl Hits erreicht wird. Dieses Verfahren führt oft dazu, daß die ursprünglich gesuchte Information zwar nicht gefunden wird, dafür aber eine Menge anderer interessanter, mehr oder weniger verwandter Themen.

Diese Anbieter finanzieren sich meistens über Bandenwerbung, die auf den Seiten mit angeboten werden.

 

Kategorisieren

Wenn man genau weiß, was man sucht, z. B. ein bestimmter Gebrauchtwagen in einer bestimmten Stadt, bietet sich die Benutzung eines Categorizer an. Im Index wird der Zweig Gebrauchtwagen angezeigt. Hier kann man nun die Stadt eingeben, in der man sich befindet. Beim Suchen über einen Indexer würde man zwar viel Literatur über Gebrauchtwagen finden, enventuell sogar Angebote in New York und Tokio, aber kaum das Angebot aus seiner Stadt.

Auch hier wird die Finanzierung über Bandenwerbung durch Ankopplung an Electronic Commerce - Systemen verstärkt durchgeführt.

 

Reviewer

 

Wenn Informationen bewertet werden sollen - z. B. möchte Aktien kaufen -, kann man auf den Reviewer zugreifen. Hier findet man Informationen über die Kursentwicklung und Empfehlungen zum Kauf von Aktien. Diese Angebote sind meistens kostenpflichtig, da die Bewertung durch Spezialisten auf dem Gebiet durchgeführt wird und damit hochwertige Informationen angeboten werden.

Diese Unternehmen arbeiten meistens mit einem Subscribtion - Model ( man zahlt pro Monat eine feste Summe oder einen festgelegten Betrag für die einzelnen Zugriffe).

 

Für den Aufbau und Betrieb von Suchmaschinen wird eine umfangreiche und leistungsfähige Ausstattung an Hard - und Soffware benötigt - und natürlich eine Netzanbindung mit hoher Kapazität. Die großen Suchmaschinen arbeiten deshalb nicht mit ganzen Rechnernetzen, auf die die Arbeitsbelastung aufgeteilt wird.

 

Der Prozeß der Datenbankerstellung und - abfrage wird in mehrere Teilschritte zerlegt, die von getrennten Subsystemen abgearbeitet werden. Die Teilschritte sind:

 

 

 

 

Die Arbeitsweise von Suchmaschinen

 

Schritt 1:

Suchmaschine fragt regelmäßig andere Server ab

 

Schritt 2: Nutzer fragt Suchmaschine ab

Nutzer / WWW - Client

 

Suchmaschine

 

 

 

 

 

 

 

 

 

Arbeitsweise von Suchmaschinen

das Einsammeln der Rohdaten

 

Das Einsammeln der Dokumente wird von sogenannten "Robots" oder "Speichers" erledigt. Diese Such - und Sammelroboter machen sich die Verweisstruktur des WWW zunutze, also die Hypertexlinks, die nicht nur die Dokumente des WWW zu einem Netz mit Kreutz - und Querverweisen verbinden, sondern auch verweise zu Dokumenten oder Diensten außerhalb des WWW enthalten.

 

Dabei geht man von Dokumenten aus, die bereits kann man, und verfolgt man die in diesen Dokumenten enthaltenen Links zu weiteren Dokumenten. Den Inhalt der so gefundenen Dokumente untersucht man wiederum auf die darin enthaltenen Verweise, verfolgen auch diese - und so weiter. Man arbeitet durch das WWW hindurch.

 

Wenn nun ein neuer Server ans Netz geht und ein Verweis auf die Einstiegsseite dieses neuen Servers in ein Dokument eingefügt wird, das einer Suchmaschine schon bekannt ist, ist es nur eine Frage der Zeit, bis auch diese Einstiegsseitevon den Robots gefunden wird. Ausgehend aus dieser Einstiegsseite und den auf ihr enthaltenen Verweisen kann man auch den Rest des Servers abfragen.

 

Weitere Ansatzpunkte finden die Robots, indem andere Verzeichnisse nach neuen Links durchstöbern kann man, oder indem solche Server oder Newsgruppen durchsuchen kann man, die speziell für die Ankündigung neuer Angebote gedacht sind.

 

Schließlich bieten alle Suchmaschinen auch eine Möglichkeit zur Selbstanmeldung für Betreiber von Internetangeboten. So kann man neue Angebote direkt vom Urheber zur Erfassung vorgemerkt werden.

 

 

Analyse und Indexierung der eingehenden Daten

 

 

Wenn die Suchrobots die zu erfassenden Dokumente eingesammelt haben, müssen diese Dokumente für die Aufnahme in die Datenbank aufbereitet werden. Dabei gibt es erhebliche Unterschiede zwischen den Suchmaschinen, wieviel Aufwand für die Analyse und Aufbereitung betrieben wird.

 

Die Weiterentwicklung von Technologien für die Handhabung so großer Datenmengen, die dazu noch so unstrukturiert sind wie im WWW abrufbaren Dokumente, ist in vollem Gange. Alle Suchmaschinen ändern und erweitern ihr Leistungsspektrum ständig. Sie bauen dabei auf Methoden auf, die für Rechnern in großen Textbeständen, zum Beispiel Firmenarchiven oder Pressedokumentation, entwickelt wurden und passen sie an die besonderen Verhältnisse im Internet an.

 

Dabei werden die konkret eingesetzten Methoden bei fast allen Suchmaschinen vertraulich behandelt; veröffentlicht werden meist nur Angaben zu den Leistungsmerkmalen mit wenig detaillierten Angaben zum technischen Hintergrund. Aus diesem Grund sollen hier nur einige allgemeine Hinweise zu diesem Thema gegeben werden, damit vorstellen kann man, wie die Suchmaschinen ihre Datenbanken aufbauen.

 

Dokumente, die neu in die Datenbank aufgenommen werden sollen, werden zunächst automatisch analysiert. Dabei erfassen übrigens nicht alle Suchmaschinen die heruntergeladenen Dokumente im Volltext ( komplett mit allen enthaltenen Wörtern ). Manchmal werden nur die Titel und Zwischenüberschriften sowie die ersten paar Wörter erfaßt, um die Datenbanken "schlanker" zu halten.

 

Lycos und Opentext gehen sogar so weit, ein Dokument auch dann schon als erfaßt zu werten, wenn nur sei URL in einem bereits aufgenommenen Dokument auftaucht. Dabei wird davon ausgegangen, daß nicht jedes einzelne Wort notwendig ist, um den Inhalt seines Dokumentes zu erfassen. Die Entwicklung leistungsfähiger Rechner und Software macht diese Einschränkungen aber mehr und mehr überflüssig - die meisten Suchmaschinen erfassen deshalb tatsächlich den gesamten Text der eingesammelten Dokumente.

 

Die Analyse der eingehenden Dokumente zielt nicht nur darauf ab, die enthaltenen Wörter zu extrahieren, sondern auch darauf, ihre Funktion und Position im Text festzuhalten und suchbar zu machen. So wird es möglich, zu unterscheiden, ob ein Wort "nur" im Fließtext, im Titel, einer Abschnittsüberschrift, im URL oder als anklickbarer Text in einem Hyperlink vorkommt. Auch andere Elemente werden von einigen Suchmaschinen mit erfaßt, zum Beispiel die Dateinamen eingefügter Bilder Verweise auf andere Dateien, spezielle vom Autor eingefügte Stichwörter, eingebundene Java - Applets - alles, was in einem Dokument an Information steckt, kann von den Suchmaschinen verwendet werden, wenn sie entsprechend programmiert sind.

 

Die Dokumente können aber noch weiter verarbeitet werden: Excite und Infoseek Ultra verwenden aufwendige Analysverfahren, mit deren Hilfe Texte in mathematisch definierte Gegenstücke "umgerechnet" werden können. Dieses Verfahren erlaubt es nicht nur, zu einem gegebenen Dokument mit mathematisch - statistischen Methoden ähnliche Dokumente "auszurechnen" (das sogenannte Relevanz - Feedback, siehe nächster Abschnitt), sondern ermöglicht sogar Suchanfragen in natürlicher Sprache. Wenn man genaueres über die Verfahren wissen möchte, die die einzelnen Suchmaschinen einsetzen, soll man die jeweils vorhandenen Informationstexte der Suchmaschinen ansehen.

 

Die Sortierung der Treffer nach ihrer Relevanz

 

Die Ergebnisse von Suchanfragen können mitunter recht umfangreich ausfallen. Schon das Durchsehen der ersten zehn oder zwanzig Treffer kann eine Menge Zeit kosten. Um diesen Prozeß abzukürzen, versuchen die meisten Suchmaschinen die Treffer gleich so zu sortieren, daß die wichtigsten Dokumente vorn in der Liste stehen. Was dabei als "wichtig" ansehen wird, hängt davon ab, inwieweit die gefundenen Dokumente mit der Suchanfrage überstimmen. Je größer diese Übereinstimmung ist, desto "relevanter" ist ein Treffer. Im Idealfall muß man gar nicht eine längere Liste von Treffer "abarbeiten", sondern werden direkt beim ersten Dokument fündig.

 

Berechnung der Relevanz von Suchergebnissen

 

Wie wird nun die Relevanz eines Treffers berechnet?

Die wichtigsten Kriterien sind:

Je mehr Suchbegriffe in einem Dokument gefunden werden, desto höher wird es eingestuft. Wenn wir z.B. fünf Begriffe eingegeben haben, dann gilt ein Dokument, in dem vier dieser fünf Begriffe vorkommen, als "relevanter" als ein Dokument , in dem kleinere Anzahl der Suchbegriffe vorkommt. Deshalb ist es auch nicht weiter tragisch, wenn die Gesamtzahl der Treffer durch eine hohe Zahl von Suchbegriffen stark erhöht wird. Man muß nämlich nicht die gesamte Trefferliste durchgehen, da die wichtigen Treffer nur am Anfang stehen.

Die Position eines Wortes im Text gilt als Anhaltspunkt für seine Wichtigkeit. Wird ein Suchbegriff beispielsweise im Titel eines Dokuments gefunden, wird angenommen dieses Dokument sei "relevanter" als ein Dokument, in dem der Suchbegriff nur im Fließtext vorkommt. Andere hervorgehobene Positionen, die ebenfalls zur Aufwertung von Dokumenten führen, sind Überschriften, Hyperlinks und der Anfang des Fließtextes.

Wenn in einem Dokument einige der Suchbegriffe nahe beieinander liegen, so wird angenommen, dieses Dokument sei relevanter als ein Dokument, in dem die Suchbegriffe zwar auch, aber mit großem Abstand zueinander enthalten sind

Kommt ein Suchbegriff mehrmals in einem Dokument vor, so wird dieses Dokument ebenfalls höher eingestuft als Dokumente, in denen der Begriff nur einmal vorkommt.

Wörter, die in der Datenbank insgesamt besonders häufig vorkommen - etwa das Wort "internet" sind weniger dazu geeignet, ein Dokument besonders zu kennzeichnen, und fallen darum weniger ins Gewicht. Wörter, die in der Datenbank seltener sind, werden als spezifischer angesehen und deshalb höher bewertet.

Diese Kriterien fließen mit unterschiedlicher Gewichtung ein, wenn die Suchergebnisse und vor allem die Trefferreihenfolge berechnet werden. Dabei wird für alle Treffer eine "Score" berechnet, also eine Punktzahl, die entweder in Prozenten oder in absoluten Zahlen ausgegeben wird. Bei der Anzeige werden dann die Dokumente nach Punktzahl geordnet ausgegeben.

 

Was die Suchmaschinen nicht finden

 

Es gibt eine Reihe von Gründen, warum Suchmaschinen bestimmte Dokumente nicht finden und deshalb nicht in ihre Datenbank aufnehmen können, so das diese Informationen mit Suchmaschinen nicht gefunden werden.

 

Neu erstellte oder geänderte Dokumente

 

Wenn neu erstellte Dokumente veröffentlicht werden, dauert es eine Weile, bis die Suchmaschinen diese neuen Dokumente durch das Verfolgen von Verweisen "finden" - sofern überhaupt solche Verweise existieren. Wenn es also Dokumente oder ganze Server gibt, auf die von außen keine Verweise zeigen ( zum Beispiel, weil sie gerade erst in Betrieb gegangen sind) und die auch nicht von ihren Betreibern bei den Suchmaschinen "angemeldet" wurden, können sie nicht von den Suchmaschinen gefunden und erfaßt werden.

 

Ähnliches gilt für geänderte Dokumente: Die Änderungen werden erst beim nächsten Aktualisierungszyklus der jeweiligen Suchmaschine wahrgenommen, wenn die bereits erfaßten Seiten auf Veränderungen geprüft werden. Das kann je nach Suchmaschine von einer bis zu mehreren Wochen dauern.

 

Geschützte Dokumente

 

Dokumente und Daten, die durch Paßwörter geschützt sind, hinter Firewalls liegen oder aus anderen Gründen nicht öffentlich abrufbar sind, werden von den Suchmaschinen nicht erfaßt. Darüber hinaus kann auch jeder Betreiber eines Servers festlegen, daß der gesamte Server oder einzelne Teilbereiche nicht von den Suchrobotern besucht werden sollen. Dazu muß lediglich eine Datei mit den entsprechenden "Verboten" an einem vereinbartem Platz abgelegt werden. Alle etablierten Suchmaschinen halten sich an diesen Standart und erfassen derart ausgeschlossene Bereiche nicht.

 

Bei manchen WWW - Server muß man sich zunächst als Benutzer "registrieren" lassen, auch wenn sie eigentlich kostenlos nutzbar sind. Auch solche Server werden von Suchmaschinen nicht abgefragt - genauer gesagt, werden nur die Bereiche erfaßt, die ohne Registrierung oder Paßworteingabe erreichbar sind.

 

Deutsche Suchmaschinen

 

Da sind Suchmaschinen, die nur deutschsprachige Seiten erfassen ( gleichgültig, zu welcher Domain der jeweilige Server gehört). Diese Suchmaschinen sind bisher nicht erwähnt worden. Zum Zeitpunkt 1996-1997 waren die deutschen Suchmaschinen weder von der Datenbankgröße noch von der Aktualität, Suchgeschwindigkeit und Funktionalität her konkurrenzfähig mit den amerikanischen Suchmaschinen.

 

Mit "Datenbankgröße" ist hier übrigens nicht Gesamtgröße der amerikanischen Suchmaschinen gemeint ( das wäre ein unfairer Vergleich), sondern nur der Anteil dort gespeicherter deutschsprachiger Dokumente. Dieser Anteil ist größer als die Gesamtgröße der Datenbanken aller deutschen Suchmaschinen. Deshalb ist es im Regelfall - zumindest zur Zeit - zu empfehlen, die internationalen Suchmaschinen zu verwenden. Schließlich erhielt man dort mit der Eingabe deutscher Suchbegriffe auch deutschsprachige Ergebnisse.

 

Deutsche Suchmaschinen

 

Flipper

http://flp.cs.tu-berlin.de/flipper/

Hotlist

http://www.hotlist.de/

Kolibri

http://www.kolibri.de/

Crawer

http://www.crawer.de/

Aladin

http://www.aladin.de/

 

 

Bei den Suchmaschinen zeigt sich allmählich die gleiche Tendenz wie im Internet überhaupt: sie schießen wie die Pilze aus dem Boden, und jeder Betreiber versucht die Konkurrenz zu übertrumpfen.

 

Verschiedene Suchmaschinen verstehen die selbe Frage anders

 

Wenn man bei verschiedenen Suchmaschinen identische Anfragen ausprobiert, wird man feststellen, daß die Sortierung und die Antwort sehr unterschiedlich ausfächlt.

Z. B. ich nehme folgende Suchmaschienen:

www.excite.com)

www.lycos.com)

www.yahoo.com)

 

Die Frage:

Die Antwort bei verschiedenen Suchmaschienen

 

 

 

 

 

iiiiiiiiii