Anzeige

Yacy - Suchmaschine auf Peer-to-Peer-Basis

Prefetch-Funktion nimmt Umfeld von Webseiten in Suchindex auf

Mit Yacy geht eine Suchmaschine auf Peer-to-Peer-Basis an den Start, um sich so bei der Internetsuche unabhängig von einem einzelnen Anbieter wie etwa Google, Yahoo oder Microsoft machen zu können. Wie von Tauschbörsen bekannt, trägt jeder Nutzer seinen Teil dazu bei, damit der Dienst funktioniert. Jeder Nutzer steuert dazu für einen globalen Suchindex seinen lokalen Suchindex bei.

Anzeige

Zur Nutzung der Yacy-Suchmaschine muss eine Java-Software auf dem eigenen Rechner installiert werden, die eine Art lokalen Proxy-Server darstellt. In diesem Zwischenspeicher landen alle mit dem eigenen Rechner besuchten Webseiten und werden dann als Volltext und mit Schlagworten versehen in einen Suchindex integriert. Bei herkömmlichen Suchmaschinen grast eine Robot-Software das Internet nach Webseiten ab und fügt die gefundenen Seiten in den Suchindex ein, während dies bei Yacy quasi vom Anwender übernommen wird.

Damit der eigene Suchindex nicht nur die selbst besuchten Webseiten verarbeitet, gibt es eine so genannte Prefetch-Funktion, womit das Umfeld der besuchten Seite im Hintergrund abgegrast und ebenfalls in den Suchindex aufgenommen wird. Damit sich der Volltextindex leicht durchsuchen lässt, gehört zu Yacy auch ein Web-Server.

Die Weite bzw. Tiefe der Umfeldsuche lässt sich in der Software einstellen, allerdings ist zu beachten, dass die Anzahl der durch diesen Mechanismus geladenen Webseiten exponenziell und somit sehr schnell ansteigt. Man sollte also hier keine zu hohen Werte setzen. Geht man exemplarisch davon aus, dass sich auf jeder Webseite 30 Links befinden und der Prefetch-Wert auf 1 gestellt ist, werden 30 andere Webseiten von Yacy abgerufen. Bei einem Prefetch-Wert von 2 wird der Linkwert mit sich selbst multipliziert (30 x 30), so dass dies bereits den Aufruf von 900 Webseiten bedeuten würde.

Die P2P-Funktionen kommen dann zum Zuge, wenn Suchanfragen über die Yacy-Software gestartet werden. Denn neben dem selbst angelegten Suchindex werden auch die Indexdaten der anderen gerade aktiven Yacy-Nutzer abgefragt, was einen entsprechend großen globalen Suchindex ergibt. Durch den dezentralen Aufbau der Yacy-Suchmaschine sollen Ausfälle der Suchmaschine auf ein Minimum reduziert werden. Außerdem macht man sich so unabhängig von Firmen, die ansonsten für die Bereitstellung von Suchmaschinen verantwortlich zeichnen.

Die Yacy-Software wird für die Plattformen Windows, Linux und MacOS X kostenlos zum Download angeboten und verlangt zwingend nach Java 2.


eye home zur Startseite
io++ 23. Dez 2005

Was für eine Sprache ist das denn?

Yacy Dev Team 23. Dez 2005

NEIN Klar Werden Die Seiten Indiziert doch Überleg mal wenn du einen normalen webservice...

Franky 23. Dez 2005

Was ja auch beabsichtigt und gut ist somit ist ein gross teil der schlechten seiten die...

kressevadder 14. Feb 2005

Wenn mir jetzt noch einer erklären kann, warum ich nen Suchmaschinenindex mit 15000...

gast 13. Feb 2005

japp.....und dazu gaaanz viel apfelkuchen

Kommentieren


Suchmaschinen News / 11. Feb 2005

Neue Suchmaschine Yacy geht an den Start



Anzeige

  1. Systemadministrator (m/w)
    über MENSCH + AUFGABE PERSONALBERATUNG DOROTHEE SCHMALBACH, Stuttgart
  2. Anwendungsentwickler (m/w) i.s.h.med / COPRA6
    Universitätsmedizin der Johannes Gutenberg-Universität Mainz, Mainz
  3. Senior Project Manager - Healthcare (m/w)
    Fresenius Netcare GmbH, Bad Homburg
  4. Sachbearbeiter (m/w)
    Bundeskartellamt, Bonn

Detailsuche



Anzeige
Blu-ray-Angebote
  1. 3 Blu-rays für 18 EUR
    (u. a. Rache für Jesse James, Runaway, The Wanderers)
  2. 3 Blu-rays für 20 EUR
    (u. a. Spaceballs, Anastasia, Bullitt, Over the top, Space Jam)
  3. TIPP: Der Hobbit: Die Schlacht der fünf Heere [3D Blu-ray]
    9,99€

Weitere Angebote


Folgen Sie uns
       


  1. Internetwirtschaft

    Das ist so was von 2006

  2. NVM Express und U.2

    Supermicro gibt SATA- und SAS-SSDs bald auf

  3. 100 MBit/s

    Telekom bringt 10.000 Haushalten in Großstadt Vectoring

  4. Zum Weltnichtrauchertag

    BSI warnt vor Malware in E-Zigaretten

  5. Analoges Radio

    UKW-Sendeanlage bei laufendem Betrieb umgezogen

  6. Kernel

    Linux 4.7-rc1 unterstützt AMDs Polaris

  7. Fehler in Blogsystem

    200.000 Zugangsdaten von SZ-Magazin kopiert

  8. Aufräumen von Prozessen beim Logout

    Systemd-Neuerung sorgt für Nutzerkontroversen

  9. Overwatch im Test

    Superhelden ohne Sammelsucht

  10. Mobilfunk

    Wirtschaftssenatorin will 5G-Testbed in Berlin durchsetzen



Haben wir etwas übersehen?

E-Mail an news@golem.de


Anzeige
GPD XD im Test: Zwischen Nintendo 3DS und PS Vita ist noch Platz
GPD XD im Test
Zwischen Nintendo 3DS und PS Vita ist noch Platz
  1. Gran Turismo Sport Ein Bündnis mit der Realität
  2. Xbox Scorpio Schneller als Playstation Neo und mit Rift-Unterstützung
  3. AMD Drei Konsolen-Chips für 2017 angekündigt

Xperia X im Hands on: Sonys vorgetäuschte Oberklasse
Xperia X im Hands on
Sonys vorgetäuschte Oberklasse
  1. Die Woche im Video Die Schoko-Burger-Woche bei Golem.de - mmhhhh!
  2. Android 6.0 Ein großer Haufen Marshmallow für Samsung und Co.
  3. Google Android N erscheint auch für Nicht-Nexus-Smartphones

Oracle vs. Google: Wie man Geschworene am besten verwirrt
Oracle vs. Google
Wie man Geschworene am besten verwirrt
  1. Oracle-Anwältin nach Niederlage "Google hat die GPL getötet"
  2. Java-Rechtsstreit Oracle verliert gegen Google
  3. Oracle vs. Google Wie viel Fair Use steckt in 11.000 Codezeilen?

  1. Re: Kein Splitscreen

    TheUnichi | 22:13

  2. Re: Damit erhöht sich die digitale Kluft...

    brainslayer | 22:11

  3. Re: Seit ET kein interessanter Shooter mehr...

    Eheran | 22:11

  4. Re: Gehirnwäsche durch Apple

    Neuro-Chef | 22:09

  5. Re: Völliger Quatsch.

    ThaKilla | 22:08


  1. 18:53

  2. 18:47

  3. 18:38

  4. 17:41

  5. 16:36

  6. 16:29

  7. 15:57

  8. 15:15


  1. Themen
  2. A
  3. B
  4. C
  5. D
  6. E
  7. F
  8. G
  9. H
  10. I
  11. J
  12. K
  13. L
  14. M
  15. N
  16. O
  17. P
  18. Q
  19. R
  20. S
  21. T
  22. U
  23. V
  24. W
  25. X
  26. Y
  27. Z
  28. #
 
    •  / 
    Zum Artikel