• IT-Karriere:
  • Services:

Gigablast: freier Suchindex mit Skalierungspotenzial

Gigablast erstellt einen eigenen Index, greift also nicht wie Metasuchmaschinen auf Ergebnisse anderer Suchangebote zurück. Das Projekt wird seit dem Jahr 2000 von Hauptentwickler Matt Wells betreut und zusammen mit einer Handvoll Programmierern weiterentwickelt.

Stellenmarkt
  1. Stadt Frankfurt am Main, Frankfurt am Main Innenstadt
  2. MLF Mercator-Leasing GmbH & Co. Finanz-KG, Schweinfurt

Die Suchmaschine ist laut Wells in der Lage, Hunderte Milliarden Webseiten zu indexieren, lässt sich in großen Clustern betreiben und so auf Tausende Server skalieren. Als Systemvoraussetzung geben die Entwickler eine Linux-Maschine mit Kernelversion 2.4.25 oder neuer an sowie mindestens 4 GB Arbeitsspeicher und 10 GB Festplattenplatz für den Index. Die Größe des Index hängt dabei natürlich davon ab, wie viele Webseiten indiziert werden sollen. Eine kostenpflichtige Pro-Version soll weitere Features bereitstellen und zudem 20- bis 30-mal so schnell suchen wie die normale Version.

Die Installation ist einfach

Installationspakete für die freie Version stehen für Debian- sowie Redhat-basierte Systeme jeweils für 32-bit und 64-bit zum Download bereit. So wird die Installation von Gigablast mit dem distributionseigenen Paketmanager denkbar einfach. Nach der Installation lässt sich die Suchmaschine per "sudo gb -d" als Daemon starten und steht anschließend unter http://localhost:8000 zur Verfügung. Eine leicht verständliche Kurzanleitung sowie umfangreiche (wenn auch zum Teil etwas angestaubte) Informationen zu API, Cluster-Management und allgemeiner Konfiguration stehen auf Englisch auf der Webseite des Projekts zur Verfügung.

Die Installation klappte auf unserem Testsystem problemlos. Nachdem wir in der Konfigurationsmaske die Domain Golem.de zum Indexieren eingetragen hatten, legte Gigablast sofort los. Auf ein vollständiges Indexieren des Internets haben wir für dieses Howto verzichtet, für unseren Suchbegriff-Test haben wir stattdessen auf die öffentliche Demo zurückgegriffen.

Die Demo ist für Entwickler gedacht

Die Standardoberfläche von Gigablast wirkt etwas altbacken, ist aber übersichtlich gestaltet. Ein Menü am linken Bildschirmrand erinnert daran, dass die Suchmaske unter Gigablast.com lediglich als Demo für Interessierte gedacht ist, denn seine zehn Menüpunkte richten sich eher an Entwickler als an Nutzer. Nach Eingabe eines Suchbegriffs zeigt Gigablast eine Reihe nützlicher Funktionen wie Zeiteinschränkung, Sortierreihenfolge, Sprachauswahl, Dateitypenauswahl und Familienfilter an, die die Präzisierung der Suche ermöglichen.

  • Start von Gigablast über die Linux-Kommandozeile. (Screenshot: Golem.de/Jan Weisensee)
  • Startseite von Gigablast. (Screenshot: Golem.de/Jan Weisensee)
  • Einstellungsdialog von Gigablast (Screenshot: Golem.de/Jan Weisensee)
  • Gigablast-Crawler (Screenshot: Golem.de/Jan Weisensee)
Einstellungsdialog von Gigablast (Screenshot: Golem.de/Jan Weisensee)

Die Suchergebnisse sind durchwachsen

Unsere erste Suche nach dem Autor des Buches "Die Entdeckung der Langsamkeit" führte zu gemischten Ergebnissen. Einerseits brachte uns gleich der erste Treffer ans Ziel, nämlich auf eine alphabetische Autorenliste der Webseite Zitate.eu, die unter anderem den Autor Sten Nadolny und sein oben genanntes Werk enthält. Andererseits war dies auch der einzig sinnvolle Treffer. Mit der Entdeckung der Langsamkeit brachte Gigablast ansonsten nur Flusskreuzfahrten, SlowTV und einen Focus-Artikel über das Wanderleben Jesus Christi in Verbindung.

Etwas besser klappte die Suche nach den Mitgliedern des NSA-Untersuchungsausschusses des Deutschen Bundestags. Auf einen wenig relevanten Treffer folgte ein Link zu einem Ausschussdokument auf Wikileaks, auf dessen erster Seite sich eine Mitgliederliste findet. Wirklich passend war aber erst Treffer 9, der uns direkt auf die leider englischsprachige Wikipedia-Seite des Ausschusses lotste. Dass hier nicht die deutsche Übersetzung erscheint, ist schade.

Befragt man Gigablast nach "ios 10 schwachstelle", bekommt man einige Treffer zu älteren Sicherheitslücken in iOS 7 und 9 präsentiert, wird ansonsten aber eher enttäuscht. Offenbar lässt sich die Suchmaschine von der Zahl 10 irritieren, denn sieben unserer ersten zehn Treffer hatten nichts oder nur am Rande mit Lücken in Apples Betriebssystemen zu tun.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed
 Howto: Goodbye Google? Suchmaschinen selber hostenMetager: das deutsche Universitätsprojekt 
  1.  
  2. 1
  3. 2
  4. 3
  5. 4
  6. 5
  7. 6
  8. 7
  9.  


Anzeige
Hardware-Angebote
  1. (reduzierte Überstände, Restposten & Co.)

Daseuter 11. Okt 2017

Ich muss meinem Vorredner voll und ganz zustimmen. Ich bin von www.quadrazid.com auch...

crystalgazer 18. Okt 2016

aber es ist wie mit allem, man muß sich gewaltig dahinterklemmen um ein gutes System mit...

svGG_81 09. Okt 2016

Goldrichtig. Man muss keine Informatik studiert haben um sich ein paar Terminalbefehle...

igor37 09. Okt 2016

Nur muss ich dann einen Browser verwenden, der das unterstützt und auf 2 Geräten mit...

WeitWeitWeg 08. Okt 2016

Unterschiedliche Themengebiete: Was ist deine Messlatte für schlechte Ergebnisse? Wie...


Folgen Sie uns
       


VW ID.3 Probe gefahren

Wir sind einen Tag lang mit dem ID.3 in und um Berlin herum gefahren.

VW ID.3 Probe gefahren Video aufrufen
IT-Unternehmen: Die richtige Software für ein Projekt finden
IT-Unternehmen
Die richtige Software für ein Projekt finden

Am Beginn vieler Projekte steht die Auswahl der passenden Softwarelösung. Das kann man intuitiv machen oder mit endlosen Pro-und-Contra-Listen, optimal ist beides nicht. Ein Praxisbeispiel mit einem Ticketsystem.
Von Markus Kammermeier

  1. Anzeige Was ITler tun können, wenn sich jobmäßig nichts (mehr) tut
  2. IT-Jobs Lohnt sich ein Master in Informatik überhaupt?
  3. Quereinsteiger Mit dem Master in die IT

Wissen für ITler: 11 tolle Tech-Podcasts
Wissen für ITler
11 tolle Tech-Podcasts

Die Menge an Tech-Podcasts ist schier unüberschaubar. Wir haben ein paar Empfehlungen, die die Zeit wert sind.
Von Dennis Kogel


    Star auf Disney+: Erstmal sollten Fehler korrigiert werden
    Star auf Disney+
    Erstmal sollten Fehler korrigiert werden

    Statt zunächst Fehler zu beheben, bringt Disney+ lieber neue Inhalte - und damit auch neue Fehler.
    Ein IMHO von Ingo Pakalski

    1. Disney+ Zwei Star-Wars- und fünf Marvel-Serien kommen 2021
    2. Neue Profile von Disney+ im Hands-on Gelungener PIN-Schutz und alte Fehler
    3. Netflix-Konkurrenz Disney+ noch zum günstigeren Abopreis zu bekommen

      •  /