Zum Hauptinhalt Zur Navigation

Apache Software Foundation: Sechs neue Projekte

Die Apache Software Foundation (ASF) hat auf einen Schlag sechs neue Top-Level-Projekte angekündigt, ein Rekord für die Organisation. Dazu zählt der Apache Traffic Server ebenso wie die Projekte Mahout, Tika, Nutch, Avro und HBase.
/ Jens Ihlenfeld
7 Kommentare News folgen (öffnet im neuen Fenster)

Die sechs neuen Apache-Projekte entstammen dem Apache Incubator oder gehen aus bestehenden Initiativen hervor. Insgesamt betreut die Stiftung nun 143 Open-Source-Projekte. Der Status eines Apache-Top-Level-Projekts drückt aus, dass die Community und die Produkte eines Projekts entsprechend den Regeln der Stiftung geführt werden, die auf einen leistungsorientierten und konsensgetriebenen Entscheidungsprozess setzt.

Zu den neuen Apache-Projekten zählt unter anderem der aus dem Apache Inkubator stammende Apache Traffic Server(öffnet im neuen Fenster) , ein schneller, skalierbarer und erweiterbarer HTTP/1.1-Proxy. Er wurde ursprünglich von Yahoo entwickelt und 2009 an die ASF übertragen. Er wird genutzt, um statische Inhalte wie Bilder, Javascript-, CSS- und HTML-Dateien auszuliefern und Anfragen nach dynamischen Inhalten an Webserver zu verteilen. Dabei soll das System mehr als 75.000 Anfragen pro Sekunde verarbeiten. Es kommt bei Yahoo zum Einsatz, wo es einen Traffic von 400 TByte pro Tag bewältigt und mehr als 30 Milliarden Objekte ausliefert.

Aus einem bereits existierenden Top-Level-Projekt geht Apache Mahout(öffnet im neuen Fenster) hervor, das eine skalierbare Implementierung von maschinenlernenden Algorithmen auf Basis von Apache Hadoop bereitstellt. Mahout begann als Subprojekt von Lucene im Jahr 2008 und liegt heute in der Version 0.4 vor.

Apache Tika(öffnet im neuen Fenster) ist ein einbettbares Toolkit zur Content-Erkennung und -Analyse. Es nutzt dazu MIME-Standards und Spracherkennungsfunktionen. Auch Tika entstand ursprünglich im Rahmen des Lucene-Projekts(öffnet im neuen Fenster) und kommt dementsprechend in einigen Lucene-Produkten zum Einsatz, beispielsweise bei Solr(öffnet im neuen Fenster) , Nutch und Mahout.

Ähnliches gilt für die Websuchmaschine Nutch(öffnet im neuen Fenster) , die Apache ebenfalls aus dem Lucene-Projekt zum Top-Level-Projekt befördert. Nutch umfasst einen Crawler, eine Datenbank für Verweise und einen Parser für HTML und andere Formate.

Apache Avro(öffnet im neuen Fenster) ist ein schnelles System zur Datenserialisierung, das aus dem Hadoop-Projekt(öffnet im neuen Fenster) hervorgeht. Daher kommt auch Apache HBase(öffnet im neuen Fenster) , eine verteilte Datenbank nach dem Vorbild von Googles Bigtable.

Alle Apache-Produkte stehen unter der Apache Software License v2.0 zur Verfügung und können unter apache.org(öffnet im neuen Fenster) heruntergeladen werden.


Relevante Themen