Caffeine
Google startet mit neuem Index durch
Google hat die Umstellung auf seinen neuen Suchindex namens Caffeine abgeschlossen. Caffeine soll vor allem für aktuellere Suchergebnisse sorgen und umfasst derzeit rund 100 Petabyte an Daten.

Rund 50 Prozent frischer seien die Ergebnisse, die Caffeine liefert, heißt es im offiziellen Google-Blog. Neu im Web veröffentlichte Inhalte werden also deutlich früher von Google gefunden als bisher. Erste Tests von Caffeine hatte Google im August 2009 angekündigt.
Googles alter Index verfügte über mehrere Datenschichten, die unterschiedlich oft aktualisiert wurden. Die Hauptschicht wurde alle paar Wochen erneuert. Für jede Aktualisierung einer Schicht wurde das gesamte Web analysiert, was zu einer erheblichen Verzögerung zwischen dem Zeitpunkt der Veröffentlichung von Informationen im Web und dem Zeitpunkt, ab dem diese bei Google gefunden werden konnten, sorgte.
Mit Caffeine ändert sich dies: Google ist dazu übergangen, das Web nur in kleinen Teilen zu analysieren und den Index kontinuierlich zu aktualisieren. Werden neue Webseiten gefunden, können sie direkt in den Index aufgenommen und somit schon sehr kurze Zeit nach der Veröffentlichung gefunden werden.
Caffeine erlaube es dabei, Webseiten in enorm großer Zahl zu indizieren. Das System verarbeite mehrere hunderttausend Seiten pro Sekunde. Derzeit umfasst der Caffeine-Index rund 100 Petabyte (etwa 100 Millionen GByte) an Daten, wobei täglich mehrere hundert TByte an Daten hinzukommen. Das System sei so auch für künftiges Wachstum gerüstet und sei eine gute Basis für die weitere Entwicklung, so Google.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
- ohne Werbung
- mit ausgeschaltetem Javascript
- mit RSS-Volltext-Feed
Es ist ein Mythos, dass elektronik nicht altert. Insbesondere Kondensatoren (zumindest...
Naja...wenn man die genetischen Informationen des Rasens in MB umrechnen würde, jeder...
Sicher das das nur ein Suchindex ist? "Petabyte" klingt für mich eher nach Website...
und welchen erfolg erhoffst du dir davon?