Bullet: Yahoo legt Abfrage-Engine für Echtzeit-Streams offen

Mit dem Open-Source-Werkzeug Bullet von Yahoo sollen Daten schon untersucht werden können, während diese in Echtzeit gestreamt werden. Für eine Big-Data-Analyse müssen die Daten damit nicht mehr aggregiert werden.

Artikel veröffentlicht am ,
Namensgeber für Software von Yahoo: Bullets
Namensgeber für Software von Yahoo: Bullets (Bild: Martin Wolf/Golem.de)

Der Begriff Big Data beschreibe längst nicht mehr nur die gesammelten Logs von Apache-Webservern in riesigen Rechenzentren, sondern auch Daten zu Leistungsmetriken, Nutzerverhalten oder von Internet-of-Things-Geräten sowie weiteren eher atypischen Daten, schreibt des Entwicklerteam von Yahoo in seinem Blog. Mit Bullet hat das Team ein Werkzeug erstellt, das die Analyse dieser Daten ermöglicht, ohne diese erst aggregieren zu müssen.

Üblicherweise werden Big-Data-Analysen bisher nur auf statisch abgelegten Daten durchgeführt, die etwa über eine bestimmten Zeitraum aufgezeichnet werden. Mit dem nun als Open-Source-Software zur Verfügung stehenden Bullet könnten Analyseanfragen jedoch auch auf Daten durchgeführt werden, die in Echtzeit durch das Netzwerk gestreamt werden. Grundlage dafür bildet das Apache-Projekt Storm.

"Im Wesentlichen kommen die Daten zu den Abfragen, statt die Abfragen dahin zu leiten, wo die Daten sind. Wenn die Bedingungen der Abfrage erfüllt sind (in der Regel ein Zeitfenster oder eine Anzahl von Ereignissen), endet die Abfrage und gibt dann das Ergebnis zurück", heißt es vereinfachend in der Beschreibung des Systems.

Bullet skaliert zu Big-Data-Analyse

Laut der Ankündigung skaliert Bullet linear in Bezug auf die Daten sowie die Anfragen. Bei Tests habe das System mehr als 700 Anfrage bei 1,5 Millionen Dateneinträgen pro Sekunde abarbeiten können. Das entspreche einem Datendurchsatz von etwa 5 GByte/s.

Yahoo selbst setze Bullet ein, um das sogenannte User-Engagement zu analysieren. Der Datensatz umfasse dabei rund 100.000 Einträge pro Sekunde, was komprimiert 130 MByte/s entspreche. Ausgeführt wird Bullet dabei auf 100 virtualisierten CPU-Kernen mit 120 GByte RAM.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed


Aktuell auf der Startseite von Golem.de
Schneller als SSDs
Eine RAM-Festplatte bricht Geschwindigkeitsrekorde

Schneller als SSDs und unendlich oft beschreibbar: Das verspricht ein Speichermedium, das RAM-Chips nutzt, aber über NVMe angesprochen wird.

Schneller als SSDs: Eine RAM-Festplatte bricht Geschwindigkeitsrekorde
Artikel
  1. Entlassungen: Amazon wirft weitere 9.000 Mitarbeiter raus
    Entlassungen
    Amazon wirft weitere 9.000 Mitarbeiter raus

    Mit der neuen Entlassungswelle hat Amazon nun 27.000 Mitarbeiter weniger.

  2. Altersdiskriminierung in der IT: Schluss mit Projekten, Sie kochen hier nur noch Kaffee
    Altersdiskriminierung in der IT
    Schluss mit Projekten, Sie kochen hier nur noch Kaffee

    Altersdiskriminierung betrifft in der IT nicht nur ältere, sondern auch junge Mitarbeiter. Ob bei Stellenausschreibung oder im Job - wann es lohnt, dafür vor Gericht zu ziehen.
    Von Harald Büring

  3. Solarstrom: Greenakku bietet Balkonkraftwerk mit Speicherakku an
    Solarstrom
    Greenakku bietet Balkonkraftwerk mit Speicherakku an

    Die Balkonkraftwerke von Greenakku sind ab sofort auch in Sets mit einem Akku verfügbar. So wird überschüssige Energie gespeichert.

Du willst dich mit Golem.de beruflich verändern oder weiterbilden?
Zum Stellenmarkt
Zur Akademie
Zum Coaching
  • Schnäppchen, Rabatte und Top-Angebote
    Die besten Deals des Tages
    • Daily Deals • Amazon Coupon-Party • MindStar: MSI RTX 4080 -100€ • Neue RAM-Tiefstpreise • Sandisk MicroSDXC 256GB -69% • Neue Wochendeals bei Media Markt • Bosch Professional-Rabatte • Otto Oster-Angebote • 38-GB-Allnet-Flat 12,99€/Monat • Meta Quest Pro 1.199€ • [Werbung]
    •  /