Freie Peer-to-Peer-Suchmaschine YaCy kommt voran
Sander-Beuermann: YaCy ist dabei, eine "kritische Masse" zu erreichen
Die Peer-to-Peer-Suchmaschine YaCy macht Fortschritte. Ziel des Projektes ist es, die Internetsuche unabhängig von einem einzelnen Anbieter wie etwa Google, Yahoo oder Microsoft zu machen. Bei Yacy trägt daher jeder Nutzer - ähnlich wie bei Tauschbörsen - einen Teil zum Gesamtsystem bei. Der globale Suchindex setzt sich so aus den lokalen Suchindizes der Nutzer zusammen.
Derzeit sei YaCy dabei, eine "kritische Masse" an Teilnehmern zu erreichen und damit eine echte Alternative zu kommerziellen Suchmaschinen zu werden, erklärt Dr. Wolfgang Sander-Beuermann, Geschäftsführer des SuMa-eV und Leiter des Suchmaschinenlabors an der Universität Hannover, das auch hinter der deutschen Meta-Suchmaschine MetaGer steckt.
Zur Nutzung der Yacy-Suchmaschine muss eine Java-Software auf dem eigenen Rechner installiert werden, die eine Art lokalen Proxy-Server darstellt. In diesem Zwischenspeicher landen alle mit dem eigenen Rechner besuchten Webseiten und werden dann als Volltext und mit Schlagworten versehen in einen Suchindex integriert. Bei herkömmlichen Suchmaschinen grast eine Robot-Software das Internet nach Webseiten ab und fügt die gefundenen Seiten in den Suchindex ein, während dies bei YaCy quasi vom Anwender übernommen wird. Über eine Blacklist lassen sich auch besuchte Seiten gezielt aus dem Index heraushalten.
Webseiten, die im Index von YaCy landen sollen, können aber auch direkt angemeldet werden. Möglich ist dies derzeit unter deruwe.de/yacy.html.
Damit der eigene Suchindex nicht nur die selbst besuchten Webseiten verarbeitet, gibt es eine so genannte Prefetch-Funktion, womit das Umfeld der besuchten Seite im Hintergrund abgegrast und ebenfalls in den Suchindex aufgenommen wird. Damit sich der Volltextindex leicht durchsuchen lässt, gehört zu YaCy auch ein Web-Server.
Die Weite bzw. Tiefe der Umfeldsuche lässt sich in der Software einstellen, allerdings ist zu beachten, dass die Anzahl der durch diesen Mechanismus geladenen Webseiten exponenziell und somit sehr schnell ansteigt. Man sollte also hier keine zu hohen Werte setzen.
Die P2P-Funktionen kommen dann zum Zuge, wenn Suchanfragen über die YaCy-Software gestartet werden, denn neben dem selbst angelegten Suchindex werden auch die Indexdaten der anderen gerade aktiven YaCy-Nutzer abgefragt, was einen entsprechend großen globalen Suchindex ergibt. Durch den dezentralen Aufbau der Yacy-Suchmaschine sollen Ausfälle der Suchmaschine auf ein Minimum reduziert werden. Außerdem macht man sich so unabhängig von Firmen, die ansonsten für die Bereitstellung von Suchmaschinen verantwortlich zeichnen.
Die Yacy-Software wird für die Plattformen Windows, Linux und MacOS X angeboten und steht unter der GPL. Ein erster Blick auf YaCy ist zudem über die Entwicklungsmaschine des SuMa-eV unter suma-lab.de:8080 möglich. Unter yacy-forum.de gibt es zudem ein Forum rund um die Peer-to-Peer-Suchmaschine.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
- ohne Werbung
- mit ausgeschaltetem Javascript
- mit RSS-Volltext-Feed
Upps, ein paar Tippfehler duerfen es sein? :)
Wenn man das hier liest: http://www.heise.de/foren/go.shtml?read=1&msg_id=8575485...
Am besten auf einem eigenen Peer, denn: a) wächst das Netzwerk b) werden alle Crawls...