Abo
  • IT-Karriere:

Gigablast: freier Suchindex mit Skalierungspotenzial

Gigablast erstellt einen eigenen Index, greift also nicht wie Metasuchmaschinen auf Ergebnisse anderer Suchangebote zurück. Das Projekt wird seit dem Jahr 2000 von Hauptentwickler Matt Wells betreut und zusammen mit einer Handvoll Programmierern weiterentwickelt.

Stellenmarkt
  1. OEDIV KG, Bielefeld
  2. Deutsches Krebsforschungszentrum (DKFZ), Heidelberg

Die Suchmaschine ist laut Wells in der Lage, Hunderte Milliarden Webseiten zu indexieren, lässt sich in großen Clustern betreiben und so auf Tausende Server skalieren. Als Systemvoraussetzung geben die Entwickler eine Linux-Maschine mit Kernelversion 2.4.25 oder neuer an sowie mindestens 4 GB Arbeitsspeicher und 10 GB Festplattenplatz für den Index. Die Größe des Index hängt dabei natürlich davon ab, wie viele Webseiten indiziert werden sollen. Eine kostenpflichtige Pro-Version soll weitere Features bereitstellen und zudem 20- bis 30-mal so schnell suchen wie die normale Version.

Die Installation ist einfach

Installationspakete für die freie Version stehen für Debian- sowie Redhat-basierte Systeme jeweils für 32-bit und 64-bit zum Download bereit. So wird die Installation von Gigablast mit dem distributionseigenen Paketmanager denkbar einfach. Nach der Installation lässt sich die Suchmaschine per "sudo gb -d" als Daemon starten und steht anschließend unter http://localhost:8000 zur Verfügung. Eine leicht verständliche Kurzanleitung sowie umfangreiche (wenn auch zum Teil etwas angestaubte) Informationen zu API, Cluster-Management und allgemeiner Konfiguration stehen auf Englisch auf der Webseite des Projekts zur Verfügung.

Die Installation klappte auf unserem Testsystem problemlos. Nachdem wir in der Konfigurationsmaske die Domain Golem.de zum Indexieren eingetragen hatten, legte Gigablast sofort los. Auf ein vollständiges Indexieren des Internets haben wir für dieses Howto verzichtet, für unseren Suchbegriff-Test haben wir stattdessen auf die öffentliche Demo zurückgegriffen.

Die Demo ist für Entwickler gedacht

Die Standardoberfläche von Gigablast wirkt etwas altbacken, ist aber übersichtlich gestaltet. Ein Menü am linken Bildschirmrand erinnert daran, dass die Suchmaske unter Gigablast.com lediglich als Demo für Interessierte gedacht ist, denn seine zehn Menüpunkte richten sich eher an Entwickler als an Nutzer. Nach Eingabe eines Suchbegriffs zeigt Gigablast eine Reihe nützlicher Funktionen wie Zeiteinschränkung, Sortierreihenfolge, Sprachauswahl, Dateitypenauswahl und Familienfilter an, die die Präzisierung der Suche ermöglichen.

  • Start von Gigablast über die Linux-Kommandozeile. (Screenshot: Golem.de/Jan Weisensee)
  • Startseite von Gigablast. (Screenshot: Golem.de/Jan Weisensee)
  • Einstellungsdialog von Gigablast (Screenshot: Golem.de/Jan Weisensee)
  • Gigablast-Crawler (Screenshot: Golem.de/Jan Weisensee)
Einstellungsdialog von Gigablast (Screenshot: Golem.de/Jan Weisensee)

Die Suchergebnisse sind durchwachsen

Unsere erste Suche nach dem Autor des Buches "Die Entdeckung der Langsamkeit" führte zu gemischten Ergebnissen. Einerseits brachte uns gleich der erste Treffer ans Ziel, nämlich auf eine alphabetische Autorenliste der Webseite Zitate.eu, die unter anderem den Autor Sten Nadolny und sein oben genanntes Werk enthält. Andererseits war dies auch der einzig sinnvolle Treffer. Mit der Entdeckung der Langsamkeit brachte Gigablast ansonsten nur Flusskreuzfahrten, SlowTV und einen Focus-Artikel über das Wanderleben Jesus Christi in Verbindung.

Etwas besser klappte die Suche nach den Mitgliedern des NSA-Untersuchungsausschusses des Deutschen Bundestags. Auf einen wenig relevanten Treffer folgte ein Link zu einem Ausschussdokument auf Wikileaks, auf dessen erster Seite sich eine Mitgliederliste findet. Wirklich passend war aber erst Treffer 9, der uns direkt auf die leider englischsprachige Wikipedia-Seite des Ausschusses lotste. Dass hier nicht die deutsche Übersetzung erscheint, ist schade.

Befragt man Gigablast nach "ios 10 schwachstelle", bekommt man einige Treffer zu älteren Sicherheitslücken in iOS 7 und 9 präsentiert, wird ansonsten aber eher enttäuscht. Offenbar lässt sich die Suchmaschine von der Zahl 10 irritieren, denn sieben unserer ersten zehn Treffer hatten nichts oder nur am Rande mit Lücken in Apples Betriebssystemen zu tun.

 Howto: Goodbye Google? Suchmaschinen selber hostenMetager: das deutsche Universitätsprojekt 
  1.  
  2. 1
  3. 2
  4. 3
  5. 4
  6. 5
  7. 6
  8. 7
  9.  


Anzeige
Top-Angebote
  1. (u. a. Hell Let Loose für 15,99€, Hitman 2 für 15,49€ und PSN Card 25 Euro [DE] für 21,99€)
  2. (u. a. SanDisk SSD Plus 1 TB für 88€ + Versand oder kostenlose Marktabholung)
  3. (u. a. MacBook 12 m3-7Y32/8 GB/256 GB/Silber für 999€ + Versand oder kostenlose Marktabholung...
  4. (u. a. MacBook 12 m3-7Y32/8 GB/256 GB/Silber für 999€ + Versand oder kostenlose Marktabholung...

Daseuter 11. Okt 2017

Ich muss meinem Vorredner voll und ganz zustimmen. Ich bin von www.quadrazid.com auch...

crystalgazer 18. Okt 2016

aber es ist wie mit allem, man muß sich gewaltig dahinterklemmen um ein gutes System mit...

svGG_81 09. Okt 2016

Goldrichtig. Man muss keine Informatik studiert haben um sich ein paar Terminalbefehle...

igor37 09. Okt 2016

Nur muss ich dann einen Browser verwenden, der das unterstützt und auf 2 Geräten mit...

WeitWeitWeg 08. Okt 2016

Unterschiedliche Themengebiete: Was ist deine Messlatte für schlechte Ergebnisse? Wie...


Folgen Sie uns
       


Radeon RX 5700 (XT) - Test

Die Navi-10-Grafikkarten schlagen die Geforce RTX 2060(S), benötigen aber etwas mehr Energie und unterstützen kein Hardware-Raytracing, dafür sind sie günstiger.

Radeon RX 5700 (XT) - Test Video aufrufen
Disintegration angespielt: Fast wie ein Master Chief mit Privatarmee
Disintegration angespielt
Fast wie ein Master Chief mit Privatarmee

Gamescom 2019 Ein dick gepanzerter Held auf dem Schwebegleiter plus bis zu vier Fußsoldaten, denen man Befehle erteilen kann: Das ist die Idee hinter Disintegration. Golem.de hat das Actionspiel ausprobiert.
Von Peter Steinlechner

  1. Omen HP erweitert das Command Center um Spiele-Coaching
  2. Games Spielentwickler bangen weiter um Millionenförderung
  3. Gamescom Opening Night Hubschrauber, Historie plus Tag und Nacht für Anno 1800

Schienenverkehr: Die Bahn hat wieder eine Vision
Schienenverkehr
Die Bahn hat wieder eine Vision

Alle halbe Stunde von einer Stadt in die andere, keine langen Umsteigezeiten zur Regionalbahn mehr: Das verspricht der Deutschlandtakt der Deutschen Bahn. Zu schön, um wahr zu werden?
Eine Analyse von Caspar Schwietering

  1. DB Navigator Deutsche Bahn lädt iOS-Nutzer in Betaphase ein
  2. One Fiber EWE will Bahn mit bundesweitem Glasfasernetz ausstatten
  3. VVS S-Bahn-Netz der Region Stuttgart bietet vollständig WLAN

10th Gen Core: Intel verwirrt mit 1000er- und 10000er-Prozessoren
10th Gen Core
Intel verwirrt mit 1000er- und 10000er-Prozessoren

Ifa 2019 Wer nicht genau hinschaut, erhält statt eines vierkernigen 10-nm-Chips mit schneller Grafikeinheit einen Dualcore mit 14++-Technik und lahmer iGPU: Intels Namensschema für Ice Lake und Comet Lake alias der 10th Gen macht das CPU-Portfolio wenig transparent.
Von Marc Sauter

  1. Neuromorphic Computing Intel simuliert 8 Millionen Neuronen mit 64 Loihi-Chips
  2. EMIB trifft Foveros Intel kombiniert 3D- mit 2.5D-Stacking
  3. Nervana NNP-I Intels 10-nm-Inferencing-Chip nutzt Ice-Lake-Kerne

    •  /