Zum Hauptinhalt Zur Navigation

Big Data

RevoscaleR: R bandelt mit Hadoop an

Revolution Analytics erweitert seine auf der freien Programmiersprache R basierende statistische Analysesoftware um Unterstützung für große Datenmengen. Damit wird es möglich, mit R Daten aus Hadoop oder NoSQL-Datenbanken gezielt zu analysieren.
undefined

Datenbanken: Hibari wird unter die Apache 2.0 Lizenz gestellt

Die nicht-relationale verteilte Datenbank Hibari wird unter die freie Apache Lizenz 2.0 gestellt. Hibari ist aufgrund seiner Geschwindigkeit und Skalierbarkeit für das Speichern großer Datenmengen geeignet, beispielsweise telemetrische Daten oder Logfiles. Hibari wurde in der Programmiersprache Erlang implementiert und bringt zahlreiche APIs mit, darunter solche für Amazons S3.
undefined

NoSQL: GraphDB wird Open Source

Die Erfurter Sones GmbH hat ihre Graphdatenbank GraphDB in der Version 1.1 veröffentlicht und bietet sie erstmals auch in einer Open-Source-Version an. Die GraphDB 1.1 verknüpft strukturierte und semistrukturierte Meta- und Binärdaten.
undefined

Q-Sensei Boost: Suchmaschine für jedermann

Eine Suchmaschine für die eigenen Daten bietet Q-Sensei mit Boost. Die Technik soll Anwendern helfen, eigene Daten schnell und leicht aufzubereiten und mit anderen zu teilen. Dabei lassen sich auch Daten aus mehreren Quellen zusammenführen.
undefined

Test: Lucid Lynx - Ubuntu im neuen Gewand

Ubuntu 10.04 LTS integriert soziale Netzwerke. Das aktuelle Ubuntu 10.04 LTS überrascht mit neuem Aussehen und weitreichender Anbindung an soziale Netzwerke. Die Bildbearbeitung Gimp weicht der Bildverwaltung F-Spot und dem Filmeditor Pitivi. Als LTS-Version veröffentlicht, soll Lucid Lynx drei Jahre lang gepflegt werden.

Hadoop erhält Googles Segen

Patentlizenz für freie Implementierung von Googles Mapreduce-Algorithmus. Das Apache-Projekt Hadoop verstößt möglicherweise gegen ein Patent von Google, doch das will Google nicht gegen die Open-Source-Projekte ins Feld führen. Damit ist ein wesentlicher Unsicherheitsfaktor des Projekts aus der Welt.
Die Golem Newsletter : Das Wichtigste für Techies und IT-Leader auf einen Blick. Jetzt abonnieren
undefined

NoSQL-Datenbank Apache Cassandra 0.6 veröffentlicht

30 Prozent schneller, mi Zeilencache und Hadoop-Unterstützung. Die von Facebook entwickelte und an die Apache Software Foundation übergebene NoSQL-Datenbank Cassandra wurde in der Version 0.6.0 veröffentlicht. Es ist die erste Cassandra-Ausgabe als Apache-Top-Level-Projekt.
undefined

Ubuntu One: Synchronisierung mit mobilen Geräten

Canonicals Cloud-Dienst gleicht mit PhoneSync Kontaktdaten per Funambol ab. Canonical will seinen Cloud-Dienst um die Synchronisierung von Kontaktdaten mit mobilen Geräten erweitern. Der Dienst soll Benutzern mit einem kostenpflichtigen Abonnement für Ubuntu One zur Verfügung stehen und wird mit dem Erscheinen von Ubuntu 10.04 freigeschaltet.
undefined

NoSQL-Datenbank MongoDB 1.4 erschienen

Leistung der dokumentenorientierten Datenbank weiter gesteigert. Mit der Version 1.4 der MongoDB haben die Entwickler der NoSQL-Datenbank erneut die Leistung der Software verbessert. Gleichzeitige Index-Abfragen und -Speicherungen sollen eine schnellere Suche ermöglichen, inaktive Slaves mit Replikation sollen einfacher gestartet werden können.
undefined

Digg: NoSQL statt MySQL

Social-Bookmark-Dienst verwendet künftig Apache Cassandra. Der Internetdienst Digg wechselt von der gegenwärtig verwendeten Datenbankinfrastruktur MySQL zu der NoSQL-Datenbank Apache Cassandra, um Leistung und Geschwindigkeit zu optimieren. Das für die Datenmigration verwendete Werkzeug Transcribe will Digg unter einer freien Lizenz veröffentlichen.
undefined

Twitters Open-Source-Webseite geht online

Microblogging-Dienst stellt seine quelloffenen Projekte vor. Auf einer eigens dafür geschaffenen Webseite stellt Twitter die Open-Source-Projekte vor, die der Anbieter für seine Microblogging-Dienste verwendet. Darunter befindet sich Ruby-Gems sowie Java-Anwendungen, die dort auch per Git zum Download freigegeben wurden.
undefined

Intel zeigt x86-Prozessor mit 48 Kernen unter Linux

Forschungschip benötigt zwischen 25 und 125 Watt. Singlechip Cloud Computer (SCC) nennt Intel seinen neuen Prozessor, der über 48 Kerne verfügt und den Weg hin zu Many-Core-Prozessoren ebnen soll. Dank feiner Stromsparfunktionen liegt die Leistungsaufnahme des Chips zwischen 25 und 125 Watt.

Yahoo spendet Traffic Server dem Apache-Projekt

Cloud-Computing-Software als Open Source freigegeben. Die von Yahoo seit mehreren Jahren entwickelte und eingesetzte Software Traffic Server geht als Spende an die Apache Software Foundation. Die Software kümmert sich um Session-Management, Authentifizierungen, Konfigurationsmanagement, Load-Balancing und Routing für eine komplette Servergruppe, die zu einer Cloud vernetzt wurde.

Raindrop - Mozilla stellt Konkurrent für Google Wave vor

Auch Mozilla will die Kommunikation im Internet revolutionieren. Nicht nur Google will mit Wave die Art und Weise, wie Menschen über das Internet kommunizieren, neu erfinden. Auch Mozilla schickt sich an, die Kommunikation im Netz umzukrempeln und stellt das Projekt Raindrop vor. Gleichzeitig veröffentlicht Mozilla einen ersten Prototypen.

Wie Facebook die Daten von 300 Millionen Nutzern verkraftet

30.000 Server, 25 TByte Logfile täglich und 600.000 Fotos pro Sekunde. Facebook ist groß, in jeder Dimension. Das sagt Jeff Rothschild, Vice President für Technologie bei Facebook bei einer Präsentation an der Universität San Diego und unterlegte dies mit Zahlen. Rothschild erläuterte die Architektur hinter Facebook und sprach über künftige technische Herausforderungen.

Cloudera Desktop: Webbasierte Verwaltung von Hadoop-Clustern

Datei- und Jobbrowser, Cluster Health und Jobdesigner veröffentlicht. Der Hadoop-Spezialist Cloudera hat mit dem Cloudera Desktop eine GUI für Apache Hadoop vorgestellt. Mit der kostenlosen Software lassen sich Applikationen auf öffentlichen und privaten Hadoop-Clustern administrieren und überwachen.

IBM-Software findet soziale Verbindungen in Mobilfunknetzen

Forscher haben Data-Mining-Tool SNAzzy entwickelt. IBM bietet Mobilfunkbetreibern das Tool SNAzzy an. Es analysiert die Kommunikationsdatensätze der Kunden, um soziale Netzwerke aufzuspüren. Wechselt einer der Nutzer den Netzbetreiber, kann die Marketingabteilung versuchen, mit Lockangeboten einen Wechsel eines ganzen Freundeskreises zu verhindern.

Yahoo hält trotz Microsoft-Deal an Hadoop fest

PHP-Erfinder will Yahoo verlassen. Die Zusammenarbeit mit Microsoft, in deren Rahmen Yahoo künftig die eigene Suchmaschine durch Microsofts Bing ersetzen will, soll keine negativen Auswirkungen auf Yahoos Hadoop-Engagement haben. Hadoop sei weiterhin wichtig.

HadoopDB - Hybrid aus Hadoop und PostgreSQL

Skalierbar und robust wie Hadoop, so schnell wie eine parallele Datenbank. Die Skalierbarkeit von Hadoop, kombiniert mit der Geschwindigkeit eines parallelen Datenbanksystems. Das soll HadoopDB bieten - ein freies paralleles shared-nothing Datenbanksystem, das mit einer an SQL angelehnten Sprache abgefragt werden kann.

Yahoo veröffentlicht eigene Hadoop-Distribution

Ausgiebig getestete und erweiterte Hadoop-Version ausschließlich im Quelltext. Yahoo hat eine eigene Distribution von Apache Hadoop angekündigt. Die bei Yahoo intern eingesetzte Hadoop-Version stellt das Unternehmen Dritten im Quelltext zur Verfügung.

Talend-Produkt zur parallelen Datenverarbeitung

Anbieter erweitert seine Datenintegrationsplattform. Talend hat die neue Produktlinie "Talend Integration Suite MPX" für die parallele Datenverarbeitung vorgestellt und verspricht hohe Leistungen bei großem Datenaufkommen. Die Software ist kompatibel zu Talends Open Studio, versteht sich aber als Enterprise-Lösung, die nicht Open Source ist.

RapidMiner 4.4 veröffentlicht

Data-Mining-Software weiter verbessert. Die freie Data-Mining-Lösung RapidMiner korrigiert in der Version 4.4 etliche Fehler und bringt einige neue Funktionen zur Datenverarbeitung mit. Die Software ist in einer kostenlosen Community Edition verfügbar, es gibt aber auch erweiterte kommerzielle Lizenzen.
undefined

Cloudera veröffentlicht Hadoop-Distribution

RPM-basierte Distribution mit webbasiertem Konfigurationsassistenten. Die Installation und Konfiguration von Hadoop ist nicht ganz einfach. Um das zu ändern, bietet Cloudera seine Hadoop-Distribution ab sofort frei zum Download an. Das Apache-Projekt dient zur Verarbeitung großer Datenmengen auf verteilten Systemen und ist an Googles Map/Reduce-Engine angelehnt.

Microsoft plant Add-on für SQL Server

"Kilimanjaro" für Business-Intelligence-Funktionen. Microsoft arbeitet an einer Erweiterung für den SQL Server 2008. Dadurch soll das Datenbanksystem um verschiedene Business-Intelligence-Funktionen erweitert werden. Vor 2010 ist jedoch nicht mit Kilimanjaro, so der Codename der Software, zu rechnen.

Hadoop-Cluster als Live-CD

OpenSolaris als Betriebssystem. Die OpenSolaris-Community hat eine Live-CD mit einem Hadoop-Cluster veröffentlicht. Vom Start bis zum voll einsatzbereiten Cluster sollen dabei nur etwa 15 Minuten vergehen. Zudem soll sich die Software mit verhältnismäßig geringen Ressourcen ausprobieren lassen.

Testzentren für Cloud-Computing

HP, Intel und Yahoo bauen Testumgebung für Cloud-Computing auch in Karlsruhe. HP, Intel und Yahoo starten eine gemeinsame Open-Source-Testumgebung für Cloud-Computing, die mehrere Rechenzentren umfasst. Damit sollen finanzielle und logistische Barrieren bei der Forschung im Bereich Cloud-Computing abgebaut werden.

Microsoft schluckt Data Warehousing-Appliances Anbieter

Unabhängiger Anbieter Datallegro nun im Paket mit Microsofts SQL Server 2008. Microsoft kauft Datallegro, einen Anbieter für Data Warehousing-Appliances. Die privat geführte Firma aus dem kalifornischen Aliso Viejo hat 100 Mitarbeiter und ist auf vorkonfigurierte Systeme aus Standardhardware und -software spezialisiert. Der bislang unabhängige Anbieter wird vom neuen Besitzer auf den "Microsoft SQL Server 2008" festgelegt.

Talend veröffentlicht Open Studio 2.4

Freie Datenintegrationssoftware in neuer Version. Talend hat auf dem LinuxTag in Berlin eine neue Version seiner Datenintegrationslösung Open Studio vorgestellt. Die Open-Source-Software erkennt in der neuen Version automatisch Änderungen an Datenstrukturen, um den Integrationsprozess anzupassen.

Yahoo schickt Slurp 3.0 ins Rennen

Neuer Crawler durchsucht das Netz für Yahoo. Yahoo hat seinen Crawler und die dahinterliegende Infrastruktur überarbeitet und schickt seinen Crawler Slurp nun in der Version 3.0 ins Netz. Im Vorfeld der Umstellung war es zu einigen ungewollten Unregelmäßigkeiten der Yahoo-Crawler gekommen.

Yahoo nimmt größten Hadoop-Cluster in Betrieb

Webmap umfasst 11 Billionen Verknüpfungen. Yahoo hat die bislang größte Hadoop-Installation in Betrieb genommen, auf der Yahoos Webmap liegt, die Basis von Yahoos Suche. Yahoos Hadoop-Installation umfasst mehr als 10.000 CPUs sowie 5 PByte Festplattenplatz.
undefined

M45 - Hadoop-Installation mit 4.000 Prozessoren für Forscher

Yahoo startet Programm zur Verbesserung von Open Source für Internet Computing. Yahoo legt ein Programm auf, um die Forschung und Entwicklung von Open-Source-System-Software für verteiltes Rechnen zu fördern. Dabei folgt Yahoo einem ähnlichen Plan von Google und IBM, stellt aber eine deutlich größere Hardware-Installation zur Verfügung.

Cluster mit 1.600 Prozessoren für Universitäten

IBM und Google wolle Internet-Scale-Computing fördern. Neue Methoden der Software-Entwicklung, mit denen sich die Herausforderungen künftiger Generationen von Internetapplikationen besser bewältigen lassen, wollen Google und IBM mit einer gemeinsamen Initiative fördern. Im Kern geht es darum, Studenten im Bereich paralleles Rechnen besser auszubilden, um so die Möglichkeiten verteilter Rechner-Ressourcen besser nutzen zu können.

Ingres bringt Business Intelligence Appliance

Zusammenarbeit mit JasperSoft. Ingres hat seine Icebreaker-Appliance mit Business-Intelligence-Software von JasperSoft ausgestattet. Kunden können so ein Paket aus Linux, der Ingres-Datenbank und Open-Source-Software für Business Intelligence erhalten, für den sie einen Ansprechpartner haben.

Kommerzielle Ausgabe der Berichts-Software JasperReports

JasperReports Professional und JasperStudio basieren auf dem Open-Source-Projekt. JasperSoft hat zur JavaOne drei kommerzielle Versionen seiner Berichtssoftware veröffentlicht. Sie basieren auf dem Open-Source-Projekt JasperReports und eignen sich zur automatisierten Datenaufbereitung, z.B. von Geschäftsberichten in Druckqualität und für das Web.

JasperSoft wird mehrsprachig

Lokalisierung der Business-Intelligence-Software über Community-Seite. JasperSoft arbeitet an Lokalisierungen seiner als Open Source verfügbaren Business-Intelligence-Software. Dabei soll nicht nur die reine Übersetzung im Vordergrund stehen, sondern die Programme sollen auch an lokale Gegebenheiten angepasst werden. Über eine Community-Seite können externe Entwickler an Lokalisierungen mitarbeiten.

Frisches Venture-Kapital für Open-Source-Anbieter Pentaho

Unternehmen entwickelt Software für den Unternehmenseinsatz. Das Unternehmen Pentaho hat in einer weiteren Finanzierungsrunde acht Millionen US-Dollar Risikokapital von dem Investmentunternehmen New Enterprise Associates (NEA) einsammeln können. Pentaho entwickelt eine als Open Source veröffentlichte Business-Intelligence-Lösung (BI) namens "Pentaho BI Suite".

Microsoft erweitert Office um Business-Intelligence

Office PerformancePoint Server 2007 soll für Überblick im Unternehmen sorgen. Microsoft hat mit dem Office PerformancePoint Server 2007 eine Softwarelösung vorgestellt, die es Unternehmen erlauben soll, ihre Zahlen systematisch zu analysieren und ihr Geschäft so besser planen und gestalten zu können.

Microsoft will BI-Engagement stärken

Softwarekonzern kauft seinen Partner ProClarity. Mit ProClarity übernimmt Microsoft ein auf Analyse- und Visualisierungstechnologien spezialisiertes Unternehmen. Die Software von ProClarity arbeitet mit Microsofts Business-Intelligence-Plattform (BI) zusammen, zu der unter anderem der SQL Server 2005, der Office Business Scorecard Manager 2005, Excel und der SharePoint Portal Server gehören.

Oracle stellt Business Intelligence Suite vor

Der nächste Schritt in Oracles Fusionsstrategie. Oracle hat seine Business-Intelligence-Middleware mit Siebel Business Analytics vereint und bietet das kombinierte Produkt nun als Oracle Business Intelligence Suite an. Ihre Stärken soll die Lösung vor allem in Kombination mit weiteren Oracle-Produkten ausspielen.

Pentaho erhält Venture-Kapital

Open-Source-Anbieter erhält 5 Millionen US-Dollar. Pentaho, Anbieter einer Open-Source-Business-Intelligence-Lösung, hat in einer ersten Finanzierungsrunde 5 Millionen US-Dollar Venture-Kapital erhalten. Doch auch Fachwissen im Bereich Open Source soll Pentaho zur Verfügung gestellt werden.

"Business Intelligence" für Microsofts Office-Paket

Business Scorecard Manager 2005 für Microsofts Office-Paket angekündigt. Als Ergänzung für Microsofts Office-Paket hat Redmond die Software "Business Scorecard Manager 2005" angekündigt, um "Business Intelligence"-Funktionen in die Office-Software zu integieren. Auf diesem Wege lassen sich Geschäftsdaten wie Verkaufs- und Absatzzahlen mit den Sollvorgaben eines Unternehmens auf einfache Weise vergleichen, verspricht der Hersteller.

Dell: Neue Server-Generation mit Intel-64-Bit-Prozessoren

Vier neue Server im Angebot. Die neuen Dell-PowerEdge-Systeme 1800, 1850, 2800 und 2850 sind mit bis zu zwei Intel-Xeon-Prozessoren mit 64-Bit-EM64T-Architektur ausgestattet. Anwender können damit sowohl 32-Bit-Anwendungen betreiben als auch dank der EM64T-Architektur 64-Bit-Anwendungen einsetzen.