PHP7: PHP reduziert Array-Speicherbedarf deutlich
Die neuen Hashtabellen in PHP reduzieren den Speicherbedarf für Arrays deutlich, was auch die Leistung der Sprache steigert. Die finale Veröffentlichung ist für den Herbst nächsten Jahres geplant.

Leistungssteigerungen um bis zu 30 Prozent haben die PHP-Entwickler mit einer frühen Version der neuen Engine verzeichnen können. In einem aktuellen Blogeintrag erklärt Nikita Popov die neue Implementierung der Hashtabellen in PHP. Diese soll ersten Angaben zufolge auf 64-Bit-Systemen bis zu dreieinhalb Mal weniger Speicher benötigen als die vorherige.
In PHP werden Arrays in geordneten Listen von Schlüssel-Wert-Paaren gespeichert, die Zuordnung von Schlüssel und Wert geschieht dabei mittels Hashtabellen. Darüber hinaus sind Arrays in PHP entsprechend dem Hinzufügen von neuen Elementen geordnet statt etwa strikt alphanumerisch.
Interna stark verändert
Genutzt wird in der neuen Engine eine leicht angepasste Variante der internen Datenstruktur für alle Variablen - der Zvals. Diese nutzt auch die Hashtabelle, deren einzelnen Einträge, die sogenannten Buckets, nun direkt ein Zval enthalten. Das reduziert die notwendigen Speicherzuweisungen.
Ebenso sind die Buckets selbst direkt in der Hashtabelle enthalten. Zuvor ist ein eigenständiges Array von Zeigern auf die Buckets verwendet worden, um Letzteren separat Speicher zuweisen zu können. Dadurch werden die Alloc- und Free-Operation auf dem Speicher ebenfalls deutlich reduziert.
Werden zudem beim Arbeiten mit dem Array Elemente gelöscht, bekommen diese zunächst den Zval-Wert IS_UNDEF. Kommen anschließend neue Werte hinzu, werden erst die undefinierten Stellen wieder "aufgefüllt", bevor dem Array notwendigerweise neuer und größerer Speicherplatz zugewiesen wird.
Darüber hinaus ist die Suche nach den richtigen Werten in der Hashtabelle beschleunigt worden, und falls ein Array ausschließlich aus aufsteigenden ganzzahligen Werten (Integern) besteht, wird die Hashtabelle komplett übergangen. Stattdessen werden direkt die Indizes verwendet. Letztlich wird auch nur dann Speicher für Hashtabellen und Werte zugewiesen, falls tatsächlich mindestens ein Element hinzugefügt wird. Für ein zunächst leeres Array werden also ebenso weniger Operationen auf dem Speicher ausgeführt.
Deutlich weniger Speicher
Popov listet abschließend sehr deutlich auf, dass in der vorherigen Implementierung auf einem 64-Bit-System 144 Byte für jedes Element belegt werden mussten. Mit der neuen Struktur werden nur noch lediglich 36 Byte oder gar noch weniger benötigt - ein Viertel des Ursprungswertes. Dabei bleibe die eigentliche Hashtabelle jedoch außen vor.
Der Entwickler gibt jedoch zu bedenken, dass das Einbetten der Datentypen ineinander auch Nachteile haben kann. So werde etwas mehr ungenutzter Speicher als vorher belegt. Das Füllen eines Arrays mit dem gleichen Wert hat ebenfalls auf die neue Implementierung keinen Einfluss. In der alten Version führte dies noch zu einem leicht reduzierten Speicherbedarf.
Zwar seien die angegebenen Daten in vielen anderen Fällen wohl viel zu optimistisch, dennoch werde mit der neuen Technik wahrscheinlich immer weniger Speicher benötigt als zuvor. Die notwendigen Operationen werden ebenfalls reduziert, was die Leistung der Arrays deutlich steigert. Auch die API zum Zugriff auf die Arrays und Hashtabellen soll wesentlich verbessert worden sein.
Die neue Engine mit den beschriebenen Verbesserungen soll aktuellen Planungen zufolge im Herbst 2015 mit PHP 7 veröffentlicht werden.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
- ohne Werbung
- mit ausgeschaltetem Javascript
- mit RSS-Volltext-Feed
Survival of the fittest. Anscheinend ist das Gesamtkonzept so gut, dass es sich mehr oder...
Sind natürlich alles Idioten bei PHP: Theres probably some other directions one...
Manchmal habe ich das Gefühl, die "echten" Programmierer fühlen sich nur auf den Schlips...
Du kannst davon ausgehen, dass es schneller ist den Hashwert zu bilden als durch den Baum...