Yacy - Suchmaschine auf Peer-to-Peer-Basis

Prefetch-Funktion nimmt Umfeld von Webseiten in Suchindex auf

Mit Yacy geht eine Suchmaschine auf Peer-to-Peer-Basis an den Start, um sich so bei der Internetsuche unabhängig von einem einzelnen Anbieter wie etwa Google, Yahoo oder Microsoft machen zu können. Wie von Tauschbörsen bekannt, trägt jeder Nutzer seinen Teil dazu bei, damit der Dienst funktioniert. Jeder Nutzer steuert dazu für einen globalen Suchindex seinen lokalen Suchindex bei.

Artikel veröffentlicht am ,

Zur Nutzung der Yacy-Suchmaschine muss eine Java-Software auf dem eigenen Rechner installiert werden, die eine Art lokalen Proxy-Server darstellt. In diesem Zwischenspeicher landen alle mit dem eigenen Rechner besuchten Webseiten und werden dann als Volltext und mit Schlagworten versehen in einen Suchindex integriert. Bei herkömmlichen Suchmaschinen grast eine Robot-Software das Internet nach Webseiten ab und fügt die gefundenen Seiten in den Suchindex ein, während dies bei Yacy quasi vom Anwender übernommen wird.

Stellenmarkt
  1. Power BI Data Analyst (m/w/d) im Energiemanagement
    STRABAG PROPERTY & FACILITY SERVICES GMBH, München, Frankfurt/Main, Düsseldorf
  2. Anwendungsbetreuer (m/w/d) für den Bereich IT / Krankenhausinformationssyste- me (KIS)
    RehaZentren Baden-Württemberg gGmbH, Stuttgart
Detailsuche

Damit der eigene Suchindex nicht nur die selbst besuchten Webseiten verarbeitet, gibt es eine so genannte Prefetch-Funktion, womit das Umfeld der besuchten Seite im Hintergrund abgegrast und ebenfalls in den Suchindex aufgenommen wird. Damit sich der Volltextindex leicht durchsuchen lässt, gehört zu Yacy auch ein Web-Server.

Die Weite bzw. Tiefe der Umfeldsuche lässt sich in der Software einstellen, allerdings ist zu beachten, dass die Anzahl der durch diesen Mechanismus geladenen Webseiten exponenziell und somit sehr schnell ansteigt. Man sollte also hier keine zu hohen Werte setzen. Geht man exemplarisch davon aus, dass sich auf jeder Webseite 30 Links befinden und der Prefetch-Wert auf 1 gestellt ist, werden 30 andere Webseiten von Yacy abgerufen. Bei einem Prefetch-Wert von 2 wird der Linkwert mit sich selbst multipliziert (30 x 30), so dass dies bereits den Aufruf von 900 Webseiten bedeuten würde.

Die P2P-Funktionen kommen dann zum Zuge, wenn Suchanfragen über die Yacy-Software gestartet werden. Denn neben dem selbst angelegten Suchindex werden auch die Indexdaten der anderen gerade aktiven Yacy-Nutzer abgefragt, was einen entsprechend großen globalen Suchindex ergibt. Durch den dezentralen Aufbau der Yacy-Suchmaschine sollen Ausfälle der Suchmaschine auf ein Minimum reduziert werden. Außerdem macht man sich so unabhängig von Firmen, die ansonsten für die Bereitstellung von Suchmaschinen verantwortlich zeichnen.

Golem Karrierewelt
  1. Data Engineering mit Python und Spark: virtueller Zwei-Tage-Workshop
    18./19.01.2023, Virtuell
  2. Einführung in das Zero Trust Security Framework (virtueller Ein-Tages-Workshop)
    18.01.2023, virtuell
Weitere IT-Trainings

Die Yacy-Software wird für die Plattformen Windows, Linux und MacOS X kostenlos zum Download angeboten und verlangt zwingend nach Java 2.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed


io++ 23. Dez 2005

Was für eine Sprache ist das denn?

kressevadder 14. Feb 2005

Wenn mir jetzt noch einer erklären kann, warum ich nen Suchmaschinenindex mit 15000...

gast 13. Feb 2005

japp.....und dazu gaaanz viel apfelkuchen

Low012 13. Feb 2005

Meines Erachtens ist es um einiges sinnvoller, Daten für eine unabhängige, nicht...



Aktuell auf der Startseite von Golem.de
Paramount+ im Test
Paramounts peinliche Premiere

Ein kleiner Katalog an Filmen und Serien, gepaart mit vielen technischen Einschränkungen. So wird Paramount+ Disney+, Netflix und Prime Video nicht gefährlich.
Ein Test von Ingo Pakalski

Paramount+ im Test: Paramounts peinliche Premiere
Artikel
  1. Sicherheit: FBI ist zutiefst besorgt über Apples neue Verschlüsselung
    Sicherheit
    FBI ist "zutiefst besorgt" über Apples neue Verschlüsselung

    Das FBI könnte mit Apples Advanced Data Protection seinen wichtigsten Zugang zu iPhones verlieren. Doch dafür muss die Funktion von Nutzern aktiviert werden.

  2. Smartphones: Huawei schliesst große Patentverträge mit Oppo und Samsung
    Smartphones
    Huawei schliesst große Patentverträge mit Oppo und Samsung

    Huawei hat sich mit den großen Smartphoneherstellern Oppo und Samsung geeinigt, Patente zu tauschen und dafür zu zahlen.

  3. Intellectual Property: Wie aus der CPU ein System-on-Chip wird
    Intellectual Property
    Wie aus der CPU ein System-on-Chip wird

    Moderne Chips bestehen längst nicht mehr nur aus der CPU, sondern aus Hunderten Komponenten. Daher ist es nahezu unmöglich, einen Prozessor selbst zu entwickeln. Wir erklären wieso!
    Eine Analyse von Martin Böckmann

Du willst dich mit Golem.de beruflich verändern oder weiterbilden?
Zum Stellenmarkt
Zur Akademie
Zum Coaching
  • Schnäppchen, Rabatte und Top-Angebote
    Die besten Deals des Tages
    Daily Deals • Gaming-Monitore -37% • Asus RTX 4080 1.399€ • PS5 bestellbar • Gaming-Laptops & Desktop-PCs -29% • MindStar: Sapphire RX 6900 XT 799€ statt 1.192€, Apple iPad (2022) 256 GB 599€ statt 729€ • Samsung SSDs -28% • Logitech Mäuse, Tastaturen & Headsets -53% [Werbung]
    •  /