Yacy: Der Peer-to-Peer-Kandidat

Noch weiter als Searx trägt die Peer-to-Peer-Suche Yacy den Gedanken der Dezentralisierung. Anders als Searx ist Yacy nicht nur eine vollwertige Suchmaschine mit eigenem Suchindex, sie kann jeden Nutzer selbst zu einem Baustein in Yacys globalem Peer-to-Peer-Suchnetzwerk machen. Anstatt den Suchindex zentralisiert zu speichern oder bei einem Dritten abzufragen, erstellt so jede Yacy-Installation einen kleinen Teil des globalen Index. Ziel von Yacy ist ein komplettes Suchmaschinennetz in Nutzerhand, das "nicht zensierbar ist und kein Nutzerverhalten an zentraler Stelle speichert".

Stellenmarkt
  1. IT Projekt Manager (m/w/d)
    Allianz Technology SE, Unterföhring (bei München)
  2. Specialist Appliance Programming & Testing (m/f/d)
    BSH Hausgeräte Gruppe, Dillingen an der Donau
Detailsuche

Yacy wurde ursprünglich 2004 von dem deutschen Informatiker Michael Christen ins Leben gerufen, der auch heute noch als Hauptentwickler tätig ist. Inzwischen arbeiten rund 30 Freiwillige an der Weiterentwicklung des Quellcodes. Eigenen Angaben zufolge hat Yacy etwa 1,4 Milliarden Dokumente im Index, verteilt auf etwa 600 Peer-Betreiber pro Monat und rund 130.000 Suchanfragen pro Tag.

Die Einbindung der Nutzer in das Peer-to-Peer-Netz birgt potenziell aber auch Probleme, auf die die Macher selbst hinweisen. So ist rechtlich offenbar unklar was passiert, wenn der lokal installierte Yacy-Crawler illegale Inhalte indiziert und dabei seine IP-Adresse im Serverlog des Inhalteanbieters hinterlässt. Im Fall einer Beschlagnahmung des Servers könnten Strafverfolgungsbehörden diese IP-Adresse als Beweis werten, dass der Yacy-Nutzer den illegalen Inhalt angesehen hat. Im Wiki des Yacy-Projekts wird vorgeschlagen, diesem Problem mit einer Speicherung der eigenen Browserhistorie zu begegnen, um damit im Notfall belegen zu können, dass man die potenziell illegalen Inhalte gar nicht angesehen hat. Ob dies vor Gericht ausreichen würde, ist offen.

Installation für Linux, Windows oder per Tar-Archiv

Wir haben Yacys aktuelle Version 1.90 getestet. Für die Installation empfehlen die Macher mindestens 4 GB freien Speicherplatz auf der Festplatte, außerdem wird Java benötigt. Auf der Webseite hat man die Auswahl zwischen einem Apt-Repository für Debian-basierte Linuxe und dem Download eines Tar-Archivs. Letzteres lässt sich einfach in den Home-Ordner des Nutzers entpacken und darin über die Kommandozeile die Datei "./startYACI.sh" aufrufen. Anschließend steht Yacy unter http://localhost:8090 zur Verfügung.

  • Installation von Yacy auf der Linux-Kommandozeile (Screenshot: Golem.de/Jan Weisensee)
  • Startseite einer Yacy-Installation (Screenshot: Golem.de/Jan Weisensee)
  • Einstellungsdialog von Yacy (Screenshot: Golem.de/Jan Weisensee)
  • Statusseite von Yacy (Screenshot: Golem.de/Jan Weisensee)
  • Suchergebnisse von Yacy (Screenshot: Golem.de/Jan Weisensee)
Startseite einer Yacy-Installation (Screenshot: Golem.de/Jan Weisensee)
Golem Karrierewelt
  1. Cinema 4D Grundlagen: virtueller Drei-Tage-Workshop
    09.-11.01.2023, Virtuell
  2. Container Technologie: Docker und Kubernetes - Theorie und Praxis: virtueller Drei-Tage-Workshop
    14.-16.12.2022, virtuell
Weitere IT-Trainings

Als Einziger der fünf Kandidaten stellt Yacy auch ein Installationspaket für Windows bereit, das in Bezug auf Funktionsumfang und Bedienung mit der Linuxversion identisch ist.

Komplexe Bedienungsoberfläche für Admins

Die Bedienungsoberfläche von Yacy gleicht der anderer Suchmaschinen, der Admin-Bereich dagegen gestaltet sich deutlich komplexer. Neben der Möglichkeit, dem Crawler detailliert mitzuteilen, welche Domains indexiert werden sollen, gibt es umfangreiche Funktionen für Monitoring und Lastenverteilung, Layout und Portaldesign.

Neben einer Bildersuche lassen sich unter dem Link "Mehr Optionen" noch die Anzahl der Ergebnisse pro Seite wählen sowie festlegen, ob der globale Yacy-Index oder nur dessen lokal gespeicherter Teil durchsucht werden soll. Für die meisten Anwendungsfälle ist wohl Ersteres interessanter. Es ist auch dieser dezentrale Index, der dafür sorgt, dass eine Yacy-Suche im Schnitt deutlich langsamer ist als Suchanfragen in zentralisierten Indizes. Unsere Testsuchen dauerten jeweils mehrere Sekunden.

In der Suchergebnisliste fällt zudem die außergewöhnliche Einstellungsleiste am linken Bildschirmrand auf. Hier lässt sich die Suche präzisieren und beispielsweise auf bestimmte Domains, Sprachen oder - sehr praktisch - Dateitypen beschränken.

Suchergebnisse überzeugt nicht ganz

Bei der Qualität der Suchergebnisse konnte Yacy allerdings nur teilweise überzeugen. Für unseren ersten Suchbegriff lieferte uns Yacy auf den ersten Plätzen einen Artikel der christlichen Newsseite "Publik-Forum" sowie Blog- und Forumsbeiträge zu Themen, die nichts mit dem gesuchten Buchtitel zu tun haben. Außerdem einen Reisebericht des Focus über Lettland und eine Seite der Metropolregion Nürnberg. Unter den ersten zehn Treffern fanden wir keine Hinweise auf den Autor des bekannten Buches.

Die Suche nach den Mitgliedern des NSA-Untersuchungsausschusses klappte etwas besser. Der erste Link führte uns direkt auf die entsprechende Seite des Deutschen Bundestages. Der Suchbegriff "ios 10 schwachstelle" ergab nur ein gemischtes Ergebnis. Weil auch bei Yacy die iOS-Themenseite von Golem.de wieder unter den ersten Treffern lag, kamen wir zwar schnell an die gesuchten Informationen, alle anderen Links jedoch lagen eher daneben: Artikel zu Schwachstellen in OpenSSL, Symantecs Antivirus und Windows passten nicht wirklich zu unseren Suchbegriffen.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed
 Searx: Allrounder mit über 70 QuellenFazit 
  1.  
  2. 1
  3. 2
  4. 3
  5. 4
  6. 5
  7. 6
  8. 7
  9.  


Daseuter 11. Okt 2017

Ich muss meinem Vorredner voll und ganz zustimmen. Ich bin von www.quadrazid.com auch...

crystalgazer 18. Okt 2016

aber es ist wie mit allem, man muß sich gewaltig dahinterklemmen um ein gutes System mit...

svGG_81 09. Okt 2016

Goldrichtig. Man muss keine Informatik studiert haben um sich ein paar Terminalbefehle...

igor37 09. Okt 2016

Nur muss ich dann einen Browser verwenden, der das unterstützt und auf 2 Geräten mit...



Aktuell auf der Startseite von Golem.de
Bundesarbeitsgericht
Arbeitgeber müssen Arbeitszeiten zwingend erfassen

Das vollständige Urteil des BAG zur Arbeitszeiterfassung liegt nun vor. Diese muss zwingend erfolgen, aber nicht unbedingt elektronisch.

Bundesarbeitsgericht: Arbeitgeber müssen Arbeitszeiten zwingend erfassen
Artikel
  1. E-Auto-Ranking: Tesla beim ADAC-Vergleich nur im Mittelfeld
    E-Auto-Ranking
    Tesla beim ADAC-Vergleich nur im Mittelfeld

    Der ADAC hat ein neues E-Auto-Ranking für verschiedene Fahrzeugklassen veröffentlicht. Tesla ist demnach nicht mehr der Branchen-Primus.

  2. BWI entwickelt innovative KI-Lösungen für die Bundeswehr
     
    BWI entwickelt innovative KI-Lösungen für die Bundeswehr

    Künstliche Intelligenz (KI) ist eine Schlüsseltechnologie für Streitkräfte. Daher erprobt die BWI als IT-Systemhaus der Bundeswehr Potenziale und Anwendungsfelder für die Herausforderungen der Soldat*innen.
    Sponsored Post von BWI

  3. Starshield: SpaceX entwickelt militärische Starlink-Satelliten
    Starshield
    SpaceX entwickelt militärische Starlink-Satelliten

    Erdbeobachtung, verschlüsselte Kommunikation und geheime Nutzlasten - so bewirbt SpaceX eine neue Generation von Satelliten namens Starshield.

Du willst dich mit Golem.de beruflich verändern oder weiterbilden?
Zum Stellenmarkt
Zur Akademie
Zum Coaching
  • Schnäppchen, Rabatte und Top-Angebote
    Die besten Deals des Tages
    Daily Deals • Amazon Last Minute Angebote: Neue Rabatt-Aktion • NBB: Samsung Odyssey G5 WQHD/165 Hz 203,89€ u. Odyssey G9 49"/DQHD/240Hz 849,90€ • ViewSonic VX3258 WQHD/144 Hz 229,90€ • Mindstar: Alphacool Eiswolf 2 AiO 360 199€ • 4x Philips Hue White Ambiance 49,99€ [Werbung]
    •  /