Abo
  • IT-Karriere:

Yacy: Der Peer-to-Peer-Kandidat

Noch weiter als Searx trägt die Peer-to-Peer-Suche Yacy den Gedanken der Dezentralisierung. Anders als Searx ist Yacy nicht nur eine vollwertige Suchmaschine mit eigenem Suchindex, sie kann jeden Nutzer selbst zu einem Baustein in Yacys globalem Peer-to-Peer-Suchnetzwerk machen. Anstatt den Suchindex zentralisiert zu speichern oder bei einem Dritten abzufragen, erstellt so jede Yacy-Installation einen kleinen Teil des globalen Index. Ziel von Yacy ist ein komplettes Suchmaschinennetz in Nutzerhand, das "nicht zensierbar ist und kein Nutzerverhalten an zentraler Stelle speichert".

Stellenmarkt
  1. Bundesinstitut für Arzneimittel und Medizinprodukte, Bonn
  2. über unternehmensberatung monika gräter, Raum Mühldorf / Inn

Yacy wurde ursprünglich 2004 von dem deutschen Informatiker Michael Christen ins Leben gerufen, der auch heute noch als Hauptentwickler tätig ist. Inzwischen arbeiten rund 30 Freiwillige an der Weiterentwicklung des Quellcodes. Eigenen Angaben zufolge hat Yacy etwa 1,4 Milliarden Dokumente im Index, verteilt auf etwa 600 Peer-Betreiber pro Monat und rund 130.000 Suchanfragen pro Tag.

Die Einbindung der Nutzer in das Peer-to-Peer-Netz birgt potenziell aber auch Probleme, auf die die Macher selbst hinweisen. So ist rechtlich offenbar unklar was passiert, wenn der lokal installierte Yacy-Crawler illegale Inhalte indiziert und dabei seine IP-Adresse im Serverlog des Inhalteanbieters hinterlässt. Im Fall einer Beschlagnahmung des Servers könnten Strafverfolgungsbehörden diese IP-Adresse als Beweis werten, dass der Yacy-Nutzer den illegalen Inhalt angesehen hat. Im Wiki des Yacy-Projekts wird vorgeschlagen, diesem Problem mit einer Speicherung der eigenen Browserhistorie zu begegnen, um damit im Notfall belegen zu können, dass man die potenziell illegalen Inhalte gar nicht angesehen hat. Ob dies vor Gericht ausreichen würde, ist offen.

Installation für Linux, Windows oder per Tar-Archiv

Wir haben Yacys aktuelle Version 1.90 getestet. Für die Installation empfehlen die Macher mindestens 4 GB freien Speicherplatz auf der Festplatte, außerdem wird Java benötigt. Auf der Webseite hat man die Auswahl zwischen einem Apt-Repository für Debian-basierte Linuxe und dem Download eines Tar-Archivs. Letzteres lässt sich einfach in den Home-Ordner des Nutzers entpacken und darin über die Kommandozeile die Datei "./startYACI.sh" aufrufen. Anschließend steht Yacy unter http://localhost:8090 zur Verfügung.

  • Installation von Yacy auf der Linux-Kommandozeile (Screenshot: Golem.de/Jan Weisensee)
  • Startseite einer Yacy-Installation (Screenshot: Golem.de/Jan Weisensee)
  • Einstellungsdialog von Yacy (Screenshot: Golem.de/Jan Weisensee)
  • Statusseite von Yacy (Screenshot: Golem.de/Jan Weisensee)
  • Suchergebnisse von Yacy (Screenshot: Golem.de/Jan Weisensee)
Startseite einer Yacy-Installation (Screenshot: Golem.de/Jan Weisensee)

Als Einziger der fünf Kandidaten stellt Yacy auch ein Installationspaket für Windows bereit, das in Bezug auf Funktionsumfang und Bedienung mit der Linuxversion identisch ist.

Komplexe Bedienungsoberfläche für Admins

Die Bedienungsoberfläche von Yacy gleicht der anderer Suchmaschinen, der Admin-Bereich dagegen gestaltet sich deutlich komplexer. Neben der Möglichkeit, dem Crawler detailliert mitzuteilen, welche Domains indexiert werden sollen, gibt es umfangreiche Funktionen für Monitoring und Lastenverteilung, Layout und Portaldesign.

Neben einer Bildersuche lassen sich unter dem Link "Mehr Optionen" noch die Anzahl der Ergebnisse pro Seite wählen sowie festlegen, ob der globale Yacy-Index oder nur dessen lokal gespeicherter Teil durchsucht werden soll. Für die meisten Anwendungsfälle ist wohl Ersteres interessanter. Es ist auch dieser dezentrale Index, der dafür sorgt, dass eine Yacy-Suche im Schnitt deutlich langsamer ist als Suchanfragen in zentralisierten Indizes. Unsere Testsuchen dauerten jeweils mehrere Sekunden.

In der Suchergebnisliste fällt zudem die außergewöhnliche Einstellungsleiste am linken Bildschirmrand auf. Hier lässt sich die Suche präzisieren und beispielsweise auf bestimmte Domains, Sprachen oder - sehr praktisch - Dateitypen beschränken.

Suchergebnisse überzeugt nicht ganz

Bei der Qualität der Suchergebnisse konnte Yacy allerdings nur teilweise überzeugen. Für unseren ersten Suchbegriff lieferte uns Yacy auf den ersten Plätzen einen Artikel der christlichen Newsseite "Publik-Forum" sowie Blog- und Forumsbeiträge zu Themen, die nichts mit dem gesuchten Buchtitel zu tun haben. Außerdem einen Reisebericht des Focus über Lettland und eine Seite der Metropolregion Nürnberg. Unter den ersten zehn Treffern fanden wir keine Hinweise auf den Autor des bekannten Buches.

Die Suche nach den Mitgliedern des NSA-Untersuchungsausschusses klappte etwas besser. Der erste Link führte uns direkt auf die entsprechende Seite des Deutschen Bundestages. Der Suchbegriff "ios 10 schwachstelle" ergab nur ein gemischtes Ergebnis. Weil auch bei Yacy die iOS-Themenseite von Golem.de wieder unter den ersten Treffern lag, kamen wir zwar schnell an die gesuchten Informationen, alle anderen Links jedoch lagen eher daneben: Artikel zu Schwachstellen in OpenSSL, Symantecs Antivirus und Windows passten nicht wirklich zu unseren Suchbegriffen.

 Searx: Allrounder mit über 70 QuellenFazit 
  1.  
  2. 1
  3. 2
  4. 3
  5. 4
  6. 5
  7. 6
  8. 7
  9.  


Anzeige
Hardware-Angebote
  1. 72,99€ (Release am 19. September)
  2. 149,90€
  3. 289€

Daseuter 11. Okt 2017

Ich muss meinem Vorredner voll und ganz zustimmen. Ich bin von www.quadrazid.com auch...

crystalgazer 18. Okt 2016

aber es ist wie mit allem, man muß sich gewaltig dahinterklemmen um ein gutes System mit...

svGG_81 09. Okt 2016

Goldrichtig. Man muss keine Informatik studiert haben um sich ein paar Terminalbefehle...

igor37 09. Okt 2016

Nur muss ich dann einen Browser verwenden, der das unterstützt und auf 2 Geräten mit...

WeitWeitWeg 08. Okt 2016

Unterschiedliche Themengebiete: Was ist deine Messlatte für schlechte Ergebnisse? Wie...


Folgen Sie uns
       


Seasonic TX-700 Fanless und The First - Hands on (Computex 2019)

Das Prime TX-700 Fanless vo Seasonic ist das derzeit stärkste passiv gekühlte Netzteil am Markt. Die kompaktere Variante namens PX-500 wiederum passt in das The First von Monsterlabo, ein Gehäuse, um 200-Watt-Komponenten passiv zu kühlen.

Seasonic TX-700 Fanless und The First - Hands on (Computex 2019) Video aufrufen
Watch Dogs Legion angespielt: Eine Seniorin als Ein-Frau-Armee
Watch Dogs Legion angespielt
Eine Seniorin als Ein-Frau-Armee

E3 2019 Elitesoldaten brauchen wir nicht - in Watch Dogs Legion hacken und schießen wir auch als Pensionistin für den Widerstand. Beim Anspielen haben wir sehr über die ebenso klapprige wie kampflustige Oma Gwendoline gelacht.


    WD Blue SN500 ausprobiert: Die flotte günstige Blaue
    WD Blue SN500 ausprobiert
    Die flotte günstige Blaue

    Mit der WD Blue SN500 bietet Western Digital eine spannende NVMe-SSD an: Das M.2-Kärtchen basiert auf einem selbst entwickelten Controller und eigenem Flash-Speicher. Das Resultat ist ein schnelles, vor allem aber günstiges Modell als bessere Alternative zu Sata-SSDs.
    Von Marc Sauter

    1. WD Black SN750 ausprobiert Direkt hinter Samsungs SSDs
    2. WD Black SN750 Leicht optimierte NVMe-SSD mit 2 TByte
    3. Ultrastar DC ME200 Western Digital baut PCIe-Arbeitsspeicher mit 4 TByte

    Ocean Discovery X Prize: Autonome Fraunhofer-Roboter erforschen die Tiefsee
    Ocean Discovery X Prize
    Autonome Fraunhofer-Roboter erforschen die Tiefsee

    Öffentliche Vergaberichtlinien und agile Arbeitsweise: Die Teilnahme am Ocean Discovery X Prize war nicht einfach für die Forscher des Fraunhofer Instituts IOSB. Deren autonome Tauchroboter zur Tiefseekartierung schafften es unter die besten fünf weltweit.
    Ein Bericht von Werner Pluta

    1. JAB Code Bunter Barcode gegen Fälschungen

      •  /