Suche

Linux: Wieder Kernel-Diskussionen zu Subsystem für KI-Beschleuniger

Auch dreieinhalb Jahre nach ersten Streits will eine Intel-Tochter weiter Sonderregelungen für KI-Beschleuniger in Linux. Das GPU-Team ist dagegen.

Artikel veröffentlicht am ,
Die Kernel-Entwickler diskutieren weiter über den Einsatz von KI-Entwicklern. (Bild: Pixabay)

Der Entwickler Oded Gabbay des zu Intel gehörenden Start-ups Habana Labs hat auf der Mailing-Liste des Linux-Kernel den Vorschlag eingebracht, ein eigenes Subsystem für KI-Beschleuniger einzuführen. Grundlage dafür sei ein Gespräch mit Greg Kroah-Hartman, der als Nummer 2 der Linux-Kernel-Entwicklung gilt und den Vorschlag in der aktuellen Diskussion auch direkt unterstützt.

Anzeige

Seit mehr als dreieinhalb Jahren diskutiert die Linux-Kernel-Community über den Umgang mit dem Treiber-Code für KI-Beschleuniger, wie jene von Habana Labs. Insbesondere die Betreuer der GPU-Treiber fühlen sich dabei übergangen, da die Beschleuniger aus ihrer Sicht auch nur so etwas wie GPUs seien, sehr ähnlich oder gleich funktionierten und entsprechend die gleichen Regeln für beide Arten von Hardwarekategorien gelten müssten.

Das zeigt sich auch in der aktuellen Diskussion. So plant Gabbay etwa auch, eine Speicherverwaltung oder -zuweisungen für einen direkten Speicherzugriff (DMA) in das Subsystem einzubringen. Derartige Infrastruktur für übergreifende Funktionen, die von mehreren Gerätetreibern genutzt werden, bietet aber eben auch das DRM-Subsystem für die Grafiktreiber.

Weiter Streit mit GPU-Treiberentwicklern

Der DRM-Hauptbetreuer, David Airlie, zeigt sich deshalb auch weiter wenig überzeugt von der Idee, ein eigenes Subsystem für KI-Beschleuniger umzusetzen. So seien inzwischen mehrere Treiber für KI-Beschleuniger auf die DRM-Infrastruktur portiert und für die Aufnahme in dem bestehenden DRM-Subsystem eingereicht worden. Diese erfüllen die Voraussetzung für die Aufnahme. Airlie fragt deshalb: "Warum ist die Erstellung eines neuen Subsystems zu diesem Zeitpunkt erforderlich?" und schlussfolgert, dass es sich dabei erneut um einen Versuch handeln könnte, die Regeln des DRM-Subsystems zu umgehen.

Anzeige

Für die Aufnahme eines neuen GPU-Treibers in den Linux-Kernel gilt es als zwingende Voraussetzung, dass zusätzlich zu dem eigentlichen Kernel-Treiber auch ein vollständig freier User-Space-Treiber zur Verfügung steht, damit diese Kombination ausführlich getestet werden kann. Schon zu Beginn der Diskussionen hieß es, dass damit der Code besser auf Sicherheitslücken überprüft werden kann. Außerdem ist auch die langfristige Pflege des Codes aus Sicht der GPU-Betreuer deutlich leichter. Das sollte künftig auch für die Treiber der KI-Beschleuniger gelten, fordern die DRM-Maintainer.

In der aktuellen Diskussion verweist Airlie deshalb erneut darauf, dass die DRM-Maintainer Jahrzehnte an Erfahrung mit bestimmten Teilbereichen haben, insbesondere mit der Speicherverwaltung solcher Geräte oder auch der Befehlsübergabe vom Userspace an den Kernel. Intel habe etwa Dank dss Feedbacks der DRM-Maintainer viel eigenen Code durch vorhandenen Kernel-Code ersetzen können, so Airlie.

Ebenso stellt Airlie die Frage in den Raum, welche Vorteile demgegenüber ein eigenes Subsystem ohne diese derartigen Erfahrungen habe, und erinnert daran, dass Unternehmen wie Intel oder Nvidia in der Vergangenheit mehrfach versucht hätten, Treiber für reine Beschleunigergeräte als Nicht-GPU einzureichen, um die Regeln des DRM-Subsystems zu umgehen.

Mit dem neuen KI-Subsystem würden dann künftig eventuell zwei Subsysteme mit leicht ähnlichen Funktionen dasselbe Geräte verwalten, sofern es über Compute- und Grafikfähigkeiten verfügt. Airlie will solch eine Situation offenbar klar vermeiden.