Apache Software Foundation
Sechs neue Projekte
Die Apache Software Foundation (ASF) hat auf einen Schlag sechs neue Top-Level-Projekte angekündigt, ein Rekord für die Organisation. Dazu zählt der Apache Traffic Server ebenso wie die Projekte Mahout, Tika, Nutch, Avro und HBase.
Die sechs neuen Apache-Projekte entstammen dem Apache Incubator oder gehen aus bestehenden Initiativen hervor. Insgesamt betreut die Stiftung nun 143 Open-Source-Projekte. Der Status eines Apache-Top-Level-Projekts drückt aus, dass die Community und die Produkte eines Projekts entsprechend den Regeln der Stiftung geführt werden, die auf einen leistungsorientierten und konsensgetriebenen Entscheidungsprozess setzt.
Zu den neuen Apache-Projekten zählt unter anderem der aus dem Apache Inkubator stammende Apache Traffic Server, ein schneller, skalierbarer und erweiterbarer HTTP/1.1-Proxy. Er wurde ursprünglich von Yahoo entwickelt und 2009 an die ASF übertragen. Er wird genutzt, um statische Inhalte wie Bilder, Javascript-, CSS- und HTML-Dateien auszuliefern und Anfragen nach dynamischen Inhalten an Webserver zu verteilen. Dabei soll das System mehr als 75.000 Anfragen pro Sekunde verarbeiten. Es kommt bei Yahoo zum Einsatz, wo es einen Traffic von 400 TByte pro Tag bewältigt und mehr als 30 Milliarden Objekte ausliefert.
Aus einem bereits existierenden Top-Level-Projekt geht Apache Mahout hervor, das eine skalierbare Implementierung von maschinenlernenden Algorithmen auf Basis von Apache Hadoop bereitstellt. Mahout begann als Subprojekt von Lucene im Jahr 2008 und liegt heute in der Version 0.4 vor.
Apache Tika ist ein einbettbares Toolkit zur Content-Erkennung und -Analyse. Es nutzt dazu MIME-Standards und Spracherkennungsfunktionen. Auch Tika entstand ursprünglich im Rahmen des Lucene-Projekts und kommt dementsprechend in einigen Lucene-Produkten zum Einsatz, beispielsweise bei Solr, Nutch und Mahout.
Ähnliches gilt für die Websuchmaschine Nutch, die Apache ebenfalls aus dem Lucene-Projekt zum Top-Level-Projekt befördert. Nutch umfasst einen Crawler, eine Datenbank für Verweise und einen Parser für HTML und andere Formate.
Apache Avro ist ein schnelles System zur Datenserialisierung, das aus dem Hadoop-Projekt hervorgeht. Daher kommt auch Apache HBase, eine verteilte Datenbank nach dem Vorbild von Googles Bigtable.
Alle Apache-Produkte stehen unter der Apache Software License v2.0 zur Verfügung und können unter apache.org heruntergeladen werden.






Normale Beiträge landen auf der Trollwiese, offensichliches Gebahren bleibt stehen...
Wenn ich an den schlechten, weil unperformanten und sicherheitsanfälligen Apache-Server...
Pro Sekunde. Der Artikel wurde entsprechend ergänzt. Danke für den Hinweis.
... feine organisation!
Kommentieren