Gigablast: freier Suchindex mit Skalierungspotenzial

Gigablast erstellt einen eigenen Index, greift also nicht wie Metasuchmaschinen auf Ergebnisse anderer Suchangebote zurück. Das Projekt wird seit dem Jahr 2000 von Hauptentwickler Matt Wells betreut und zusammen mit einer Handvoll Programmierern weiterentwickelt.

Stellenmarkt
  1. Projektmanager "technische Administration Schulnetzwerk" (m/w/d)
    Gemeinnützige Hertie-Stiftung, Frankfurt
  2. Controllerin / Controller (m/w/d), Referat Finanzcontrolling und Risikomanagement
    GKV-Spitzenverband, Berlin
Detailsuche

Die Suchmaschine ist laut Wells in der Lage, Hunderte Milliarden Webseiten zu indexieren, lässt sich in großen Clustern betreiben und so auf Tausende Server skalieren. Als Systemvoraussetzung geben die Entwickler eine Linux-Maschine mit Kernelversion 2.4.25 oder neuer an sowie mindestens 4 GB Arbeitsspeicher und 10 GB Festplattenplatz für den Index. Die Größe des Index hängt dabei natürlich davon ab, wie viele Webseiten indiziert werden sollen. Eine kostenpflichtige Pro-Version soll weitere Features bereitstellen und zudem 20- bis 30-mal so schnell suchen wie die normale Version.

Die Installation ist einfach

Installationspakete für die freie Version stehen für Debian- sowie Redhat-basierte Systeme jeweils für 32-bit und 64-bit zum Download bereit. So wird die Installation von Gigablast mit dem distributionseigenen Paketmanager denkbar einfach. Nach der Installation lässt sich die Suchmaschine per "sudo gb -d" als Daemon starten und steht anschließend unter http://localhost:8000 zur Verfügung. Eine leicht verständliche Kurzanleitung sowie umfangreiche (wenn auch zum Teil etwas angestaubte) Informationen zu API, Cluster-Management und allgemeiner Konfiguration stehen auf Englisch auf der Webseite des Projekts zur Verfügung.

Die Installation klappte auf unserem Testsystem problemlos. Nachdem wir in der Konfigurationsmaske die Domain Golem.de zum Indexieren eingetragen hatten, legte Gigablast sofort los. Auf ein vollständiges Indexieren des Internets haben wir für dieses Howto verzichtet, für unseren Suchbegriff-Test haben wir stattdessen auf die öffentliche Demo zurückgegriffen.

Die Demo ist für Entwickler gedacht

Golem Akademie
  1. Java EE 8 Komplettkurs: virtueller Fünf-Tage-Workshop
    24.–28. Januar 2022, virtuell
  2. Azure und AWS Cloudnutzung absichern: virtueller Zwei-Tage-Workshop
    17.–18. März 2022, virtuell
Weitere IT-Trainings

Die Standardoberfläche von Gigablast wirkt etwas altbacken, ist aber übersichtlich gestaltet. Ein Menü am linken Bildschirmrand erinnert daran, dass die Suchmaske unter Gigablast.com lediglich als Demo für Interessierte gedacht ist, denn seine zehn Menüpunkte richten sich eher an Entwickler als an Nutzer. Nach Eingabe eines Suchbegriffs zeigt Gigablast eine Reihe nützlicher Funktionen wie Zeiteinschränkung, Sortierreihenfolge, Sprachauswahl, Dateitypenauswahl und Familienfilter an, die die Präzisierung der Suche ermöglichen.

  • Start von Gigablast über die Linux-Kommandozeile. (Screenshot: Golem.de/Jan Weisensee)
  • Startseite von Gigablast. (Screenshot: Golem.de/Jan Weisensee)
  • Einstellungsdialog von Gigablast (Screenshot: Golem.de/Jan Weisensee)
  • Gigablast-Crawler (Screenshot: Golem.de/Jan Weisensee)
Einstellungsdialog von Gigablast (Screenshot: Golem.de/Jan Weisensee)

Die Suchergebnisse sind durchwachsen

Unsere erste Suche nach dem Autor des Buches "Die Entdeckung der Langsamkeit" führte zu gemischten Ergebnissen. Einerseits brachte uns gleich der erste Treffer ans Ziel, nämlich auf eine alphabetische Autorenliste der Webseite Zitate.eu, die unter anderem den Autor Sten Nadolny und sein oben genanntes Werk enthält. Andererseits war dies auch der einzig sinnvolle Treffer. Mit der Entdeckung der Langsamkeit brachte Gigablast ansonsten nur Flusskreuzfahrten, SlowTV und einen Focus-Artikel über das Wanderleben Jesus Christi in Verbindung.

Etwas besser klappte die Suche nach den Mitgliedern des NSA-Untersuchungsausschusses des Deutschen Bundestags. Auf einen wenig relevanten Treffer folgte ein Link zu einem Ausschussdokument auf Wikileaks, auf dessen erster Seite sich eine Mitgliederliste findet. Wirklich passend war aber erst Treffer 9, der uns direkt auf die leider englischsprachige Wikipedia-Seite des Ausschusses lotste. Dass hier nicht die deutsche Übersetzung erscheint, ist schade.

Befragt man Gigablast nach "ios 10 schwachstelle", bekommt man einige Treffer zu älteren Sicherheitslücken in iOS 7 und 9 präsentiert, wird ansonsten aber eher enttäuscht. Offenbar lässt sich die Suchmaschine von der Zahl 10 irritieren, denn sieben unserer ersten zehn Treffer hatten nichts oder nur am Rande mit Lücken in Apples Betriebssystemen zu tun.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed
 Howto: Goodbye Google? Suchmaschinen selber hostenMetager: das deutsche Universitätsprojekt 
  1.  
  2. 1
  3. 2
  4. 3
  5. 4
  6. 5
  7. 6
  8. 7
  9.  


Daseuter 11. Okt 2017

Ich muss meinem Vorredner voll und ganz zustimmen. Ich bin von www.quadrazid.com auch...

crystalgazer 18. Okt 2016

aber es ist wie mit allem, man muß sich gewaltig dahinterklemmen um ein gutes System mit...

svGG_81 09. Okt 2016

Goldrichtig. Man muss keine Informatik studiert haben um sich ein paar Terminalbefehle...

igor37 09. Okt 2016

Nur muss ich dann einen Browser verwenden, der das unterstützt und auf 2 Geräten mit...

WeitWeitWeg 08. Okt 2016

Unterschiedliche Themengebiete: Was ist deine Messlatte für schlechte Ergebnisse? Wie...



Aktuell auf der Startseite von Golem.de
Snapdragon 8 Gen1
Der erste ARMv9-Smartphone-Drache ist da

Neuer Name, neue Kerne: Der Snapdragon 8 Gen1 nutzt ARMv9-Technik, auch das 5G-Modem und die künstliche Intelligenz sind viel besser.

Snapdragon 8 Gen1: Der erste ARMv9-Smartphone-Drache ist da
Artikel
  1. 470 - 694 MHz: Streit um DVB-T2 und Veranstalterfrequenzen spitzt sich zu
    470 - 694 MHz
    Streit um DVB-T2 und Veranstalterfrequenzen spitzt sich zu

    Nach dem Vorstoß von Baden-Württemberg, einen Teil des Frequenzbereichs an das Militär zu vergeben, gibt es nun Kritiken daran aus anderen Bundesländern.

  2. Prozessoren: Intel lagert zehn Jahre alte Hardware in geheimem Lagerhaus
    Prozessoren
    Intel lagert zehn Jahre alte Hardware in geheimem Lagerhaus

    Tausende ältere CPUs und andere Hardware lagern bei Intel in einem Lagerhaus in Costa Rica. Damit lassen sich Probleme exakt nachstellen.

  3. Factorial Energy: Mercedes und Stellantis investieren in Feststoffbatterien
    Factorial Energy
    Mercedes und Stellantis investieren in Feststoffbatterien

    Durch Festkörperakkus sollen Elektroautos sicherer werden und schneller laden. Doch mit einer schnellen Serienproduktion ist nicht zu rechnen.

Du willst dich mit Golem.de beruflich verändern oder weiterbilden?
Zum Stellenmarkt
Zur Akademie
Zum Coaching
  • Schnäppchen, Rabatte und Top-Angebote
    Die besten Deals des Tages
    Daily Deals • Nur noch heute: Bis zu 75% auf Switch-Spiele • AOC 31,5" WQHD 165Hz 289,90€ • Gaming-Sale bei MediaMarkt • G.Skill 64GB Kit DDR4-3800 319€ • Bis zu 300€ Direktabzug: u. a. TVs, Laptops • WD MyBook HDD 18TB 329€ • Switch OLED 359,99€ • Xbox Series S 275,99€ [Werbung]
    •  /