Abo
  • Services:
Anzeige
Suchmaschinen zum Selbsthosten
Suchmaschinen zum Selbsthosten (Bild: Golem.de/Jan Weisensee)

Yacy: Der Peer-to-Peer-Kandidat

Noch weiter als Searx trägt die Peer-to-Peer-Suche Yacy den Gedanken der Dezentralisierung. Anders als Searx ist Yacy nicht nur eine vollwertige Suchmaschine mit eigenem Suchindex, sie kann jeden Nutzer selbst zu einem Baustein in Yacys globalem Peer-to-Peer-Suchnetzwerk machen. Anstatt den Suchindex zentralisiert zu speichern oder bei einem Dritten abzufragen, erstellt so jede Yacy-Installation einen kleinen Teil des globalen Index. Ziel von Yacy ist ein komplettes Suchmaschinennetz in Nutzerhand, das "nicht zensierbar ist und kein Nutzerverhalten an zentraler Stelle speichert".

Anzeige

Yacy wurde ursprünglich 2004 von dem deutschen Informatiker Michael Christen ins Leben gerufen, der auch heute noch als Hauptentwickler tätig ist. Inzwischen arbeiten rund 30 Freiwillige an der Weiterentwicklung des Quellcodes. Eigenen Angaben zufolge hat Yacy etwa 1,4 Milliarden Dokumente im Index, verteilt auf etwa 600 Peer-Betreiber pro Monat und rund 130.000 Suchanfragen pro Tag.

Die Einbindung der Nutzer in das Peer-to-Peer-Netz birgt potenziell aber auch Probleme, auf die die Macher selbst hinweisen. So ist rechtlich offenbar unklar was passiert, wenn der lokal installierte Yacy-Crawler illegale Inhalte indiziert und dabei seine IP-Adresse im Serverlog des Inhalteanbieters hinterlässt. Im Fall einer Beschlagnahmung des Servers könnten Strafverfolgungsbehörden diese IP-Adresse als Beweis werten, dass der Yacy-Nutzer den illegalen Inhalt angesehen hat. Im Wiki des Yacy-Projekts wird vorgeschlagen, diesem Problem mit einer Speicherung der eigenen Browserhistorie zu begegnen, um damit im Notfall belegen zu können, dass man die potenziell illegalen Inhalte gar nicht angesehen hat. Ob dies vor Gericht ausreichen würde, ist offen.

Installation für Linux, Windows oder per Tar-Archiv

Wir haben Yacys aktuelle Version 1.90 getestet. Für die Installation empfehlen die Macher mindestens 4 GB freien Speicherplatz auf der Festplatte, außerdem wird Java benötigt. Auf der Webseite hat man die Auswahl zwischen einem Apt-Repository für Debian-basierte Linuxe und dem Download eines Tar-Archivs. Letzteres lässt sich einfach in den Home-Ordner des Nutzers entpacken und darin über die Kommandozeile die Datei "./startYACI.sh" aufrufen. Anschließend steht Yacy unter http://localhost:8090 zur Verfügung.

  • Installation von Yacy auf der Linux-Kommandozeile (Screenshot: Golem.de/Jan Weisensee)
  • Startseite einer Yacy-Installation (Screenshot: Golem.de/Jan Weisensee)
  • Einstellungsdialog von Yacy (Screenshot: Golem.de/Jan Weisensee)
  • Statusseite von Yacy (Screenshot: Golem.de/Jan Weisensee)
  • Suchergebnisse von Yacy (Screenshot: Golem.de/Jan Weisensee)
Startseite einer Yacy-Installation (Screenshot: Golem.de/Jan Weisensee)

Als Einziger der fünf Kandidaten stellt Yacy auch ein Installationspaket für Windows bereit, das in Bezug auf Funktionsumfang und Bedienung mit der Linuxversion identisch ist.

Komplexe Bedienungsoberfläche für Admins

Die Bedienungsoberfläche von Yacy gleicht der anderer Suchmaschinen, der Admin-Bereich dagegen gestaltet sich deutlich komplexer. Neben der Möglichkeit, dem Crawler detailliert mitzuteilen, welche Domains indexiert werden sollen, gibt es umfangreiche Funktionen für Monitoring und Lastenverteilung, Layout und Portaldesign.

Neben einer Bildersuche lassen sich unter dem Link "Mehr Optionen" noch die Anzahl der Ergebnisse pro Seite wählen sowie festlegen, ob der globale Yacy-Index oder nur dessen lokal gespeicherter Teil durchsucht werden soll. Für die meisten Anwendungsfälle ist wohl Ersteres interessanter. Es ist auch dieser dezentrale Index, der dafür sorgt, dass eine Yacy-Suche im Schnitt deutlich langsamer ist als Suchanfragen in zentralisierten Indizes. Unsere Testsuchen dauerten jeweils mehrere Sekunden.

In der Suchergebnisliste fällt zudem die außergewöhnliche Einstellungsleiste am linken Bildschirmrand auf. Hier lässt sich die Suche präzisieren und beispielsweise auf bestimmte Domains, Sprachen oder - sehr praktisch - Dateitypen beschränken.

Suchergebnisse überzeugt nicht ganz

Bei der Qualität der Suchergebnisse konnte Yacy allerdings nur teilweise überzeugen. Für unseren ersten Suchbegriff lieferte uns Yacy auf den ersten Plätzen einen Artikel der christlichen Newsseite "Publik-Forum" sowie Blog- und Forumsbeiträge zu Themen, die nichts mit dem gesuchten Buchtitel zu tun haben. Außerdem einen Reisebericht des Focus über Lettland und eine Seite der Metropolregion Nürnberg. Unter den ersten zehn Treffern fanden wir keine Hinweise auf den Autor des bekannten Buches.

Die Suche nach den Mitgliedern des NSA-Untersuchungsausschusses klappte etwas besser. Der erste Link führte uns direkt auf die entsprechende Seite des Deutschen Bundestages. Der Suchbegriff "ios 10 schwachstelle" ergab nur ein gemischtes Ergebnis. Weil auch bei Yacy die iOS-Themenseite von Golem.de wieder unter den ersten Treffern lag, kamen wir zwar schnell an die gesuchten Informationen, alle anderen Links jedoch lagen eher daneben: Artikel zu Schwachstellen in OpenSSL, Symantecs Antivirus und Windows passten nicht wirklich zu unseren Suchbegriffen.

 Searx: Allrounder mit über 70 QuellenFazit 

eye home zur Startseite
crystalgazer 18. Okt 2016

aber es ist wie mit allem, man muß sich gewaltig dahinterklemmen um ein gutes System mit...

svGG_81 09. Okt 2016

Goldrichtig. Man muss keine Informatik studiert haben um sich ein paar Terminalbefehle...

igor37 09. Okt 2016

Nur muss ich dann einen Browser verwenden, der das unterstützt und auf 2 Geräten mit...

WeitWeitWeg 08. Okt 2016

Unterschiedliche Themengebiete: Was ist deine Messlatte für schlechte Ergebnisse? Wie...

Akaruso 07. Okt 2016

Auch Windows und Windows-Programme (auch die teuer gekauften) manchen manchmal Probleme...



Anzeige

Stellenmarkt
  1. Bechtle Onsite Services GmbH, Neckarsulm
  2. Schaeffler Technologies AG & Co. KG, Herzogenaurach
  3. mobileX AG, München
  4. über Hanseatisches Personalkontor Rottweil, Gottmadingen (bei Singen am Htwl.)


Anzeige
Spiele-Angebote
  1. 59,99€/69,99€ (Vorbesteller-Preisgarantie)
  2. 47,99€
  3. 59,99€/69,99€ (Vorbesteller-Preisgarantie)

Folgen Sie uns
       


  1. Service

    Telekom verspricht kürzeres Warten auf Techniker

  2. BVG

    Fast alle U-Bahnhöfe mit offenem WLAN

  3. Android-Apps

    Rechtemissbrauch erlaubt unsichtbare Tastaturmitschnitte

  4. Electro Fluidic Technology

    Schnelles E-Paper-Display für Video-Anwendungen

  5. Heiko Maas

    "Kein Wunder, dass Facebook seine Vorgaben geheim hält"

  6. Virtual Reality

    Oculus Rift unterstützt offiziell Roomscale-VR

  7. FTP-Client

    Filezilla bekommt ein Master Password

  8. Künstliche Intelligenz

    Apple arbeitet offenbar an eigenem AI-Prozessor

  9. Die Woche im Video

    Verbogen, abgehoben und tiefergelegt

  10. ZTE

    Chinas großes 5G-Testprojekt läuft weiter



Haben wir etwas übersehen?

E-Mail an news@golem.de


Anzeige
Debatte nach Wanna Cry: Sicherheitslücken veröffentlichen oder zurückhacken?
Debatte nach Wanna Cry
Sicherheitslücken veröffentlichen oder zurückhacken?
  1. Sicherheitslücke Fehlerhaft konfiguriertes Git-Verzeichnis bei Redcoon
  2. Hotelketten Buchungssystem Sabre kompromittiert Zahlungsdaten
  3. Onlinebanking Betrüger tricksen das mTAN-Verfahren aus

Sphero Lightning McQueen: Erst macht es Brummbrumm, dann verdreht es die Augen
Sphero Lightning McQueen
Erst macht es Brummbrumm, dann verdreht es die Augen

Quantencomputer: Nano-Kühlung für Qubits
Quantencomputer
Nano-Kühlung für Qubits
  1. IBM Q Mehr Qubits von IBM
  2. Quantencomputer Was sind diese Qubits?
  3. Verschlüsselung Kryptographie im Quantenzeitalter

  1. Re: 1400W... für welche Hardware?

    Ach | 20:24

  2. Re: Ich weiss wie man das hin bekommt

    DG-82 | 20:15

  3. Re: Telekom-Termin = irgendwann zwischen 8 und 21 Uhr

    DG-82 | 20:14

  4. Re: Sicherheit von öffentlichen wlans

    pointX | 20:07

  5. Re: Unangenehme Beiträge hervorheben statt zu...

    plutoniumsulfat | 19:53


  1. 12:31

  2. 12:15

  3. 11:33

  4. 10:35

  5. 12:54

  6. 12:41

  7. 11:44

  8. 11:10


  1. Themen
  2. A
  3. B
  4. C
  5. D
  6. E
  7. F
  8. G
  9. H
  10. I
  11. J
  12. K
  13. L
  14. M
  15. N
  16. O
  17. P
  18. Q
  19. R
  20. S
  21. T
  22. U
  23. V
  24. W
  25. X
  26. Y
  27. Z
  28. #
 
    •  / 
    Zum Artikel