Zum Hauptinhalt Zur Navigation Zur Suche

Von KI entwickelt: KI-Slop, der aussieht wie ein Browser

Wie gut programmiert KI? Diese Frage sollte die Entwicklung eines Browsers beantworten. Wir haben ihn ausprobiert und sind enttäuscht.
/ Johannes Hiltscher
47 Kommentare Auf Google folgen (öffnet im neuen Fenster)
Substack-Seiten mag der KI-Browser - sie funktionieren mit Abstand am besten, wenn auch mit hohem Rechenaufwand. (Bild: Johannes Hiltscher/Golem.de)
Substack-Seiten mag der KI-Browser - sie funktionieren mit Abstand am besten, wenn auch mit hohem Rechenaufwand. Bild: Johannes Hiltscher/Golem.de

Die Entwickler des KI-Code-Editors Cursor wollten einmal ausprobieren, wie leistungsfähig KI-Agenten beim Programmieren aktuell sind. Also haben sie sich eines der komplexesten Softwareprojekte vorgenommen: einen Webbrowser. Praktischerweise hat Cursor-Entwickler Wilson Lin nicht nur einen Blog-Beitrag geschrieben(öffnet im neuen Fenster), sondern auch den generierten Code veröffentlicht(öffnet im neuen Fenster). Wir haben ihn ausprobiert, waren aber vom Ergebnis nur bedingt begeistert.

Die gute Nachricht vorab: Mit Clang 21 kompiliert der Code problemlos, nachdem erst einmal 528 Rust-Bibliotheken (Crates) heruntergeladen wurden. Viele davon sind Codecs und Schnittstellen, auch für Kryptografie und Kompression wird auf externe Bibliotheken zurückgegriffen. Auch ein HTML-Parser findet sich, zumindest für das Rendering scheinen die Agenten aber eigenen Code generiert zu haben.

Der Browser startet auch, und dass ein Ensemble aus KI-Agenten eine so komplexe Software erstellt hat – das Tool cloc zählt über 2,6 Millionen Zeilen Rust-Code -, ist erst einmal beeindruckend. Hunderte Agenten sollen rund eine Woche daran gearbeitet haben. Das Ergebnis sieht allerdings nur aus wie ein Browser, aber brauchbar ist es nicht.

Unter X11 (XFCE, Debian Testing) ist die Software als Browser quasi komplett unbrauchbar. Über die Adresszeile können wir nur im Ausnahmefall eine Webseite aufrufen, beim Drücken der Enter-Taste passiert meist einfach nichts. Als Workaround kann die gewünschte Seite als Startseite gesetzt werden. Dann lädt sie zwar per Klick auf den entsprechenden Button, oft stürzt der Browser dann allerdings ab.

Auch ohne Abstürze kaum mehr als ein Mock-up

Unter Wayland (Gnome mit Wayfire, Debian Testing) läuft der Browser besser: Keine vollständigen Abstürze, die Adresseingabe funktioniert. Gelegentlich funktionieren hier auch Links, was allerdings dann nie direkt erkennbar ist.

Zunächst wird nämlich das alte Bild weiter angezeigt, lediglich die Anzeige von URLs beim Mouseover eines Links verrät, dass eine andere Seite geladen wurde. Mit etwas Glück sehen wir die neue Seite, nachdem wir die Arbeitsfläche gewechselt haben. Oft passiert bei einem Klick dort, wo ein Link sein sollte, aber schlicht: nichts. Das Laden (hierfür nutzt der Browser curl) und Rendern einer Seite dauert selbst bei einfachen HTML-Seiten extrem lang.

Lediglich die eingebauten about-Seiten sind schnell gerendert, anfangs halten wir sie für die einzigen, auf denen wir scrollen können. Selbst bei einfachen Seiten wie der Wikipedia-Startseite scheint nur das bereits gerenderte Bild verschoben zu werden – und weil das so schön ist, macht der Browser das gelegentlich auch noch ein paarmal, wenn wir schon längst nicht mehr scrollen.

Auch hier hilft aber oft wieder, die Arbeitsfläche zu wechseln. Dann wird meist der neue Inhalt angezeigt. Interessanterweise werden aber Seiten auf Substack ohne diesen Workaround beim Scrollen neu gerendert, auch wenn das mehrere Sekunden dauert und einen Prozessorkern voll auslastet.

Viele Seiten funktionieren auch einfach gar nicht: Github ist komplett schwarz, auf der Golem-Homepage kommen wir nicht am Cookie-Pop-up vorbei, da das zugehörige Javascript nicht geladen wird.

Teilweise überrascht uns der KI-Browser aber auch mit sehr ungewöhnlichem Verhalten.

Immer wieder neue Überraschungen

Die Google-Startseite wird (fehlerhaft) gerendert, nutzen lässt sie sich nicht. Auch unter Wayland läuft der Browser aber nicht so stabil, wie wir zunächst annahmen. Hier stürzt nach einiger Zeit der Renderer ab, was alle Tabs unbrauchbar macht.

Apropos Tabs: Auch die sind mehr Mock-up als echte Funktion. Wir können zwar welche öffnen und schließen, ein Wechsel ist allerdings nicht möglich. Es wird immer nur der zuletzt geöffnete Tab angezeigt. Gelegentlich taucht auch unerwartet ein neuer Fehler auf: So lässt uns der Browser einmal keine Änderungen mehr in der Adresszeile vornehmen, ein gelöschtes Zeichen wird einfach wieder angehangen.

Versuchsobjekt, kein ernst zu nehmender Browser

Zugegeben: Eine echte Konkurrenz zu Chrome, Edge, Safari oder Firefox zu sein, war auch nicht das Ziel von Entwickler Lin. Ihn interessierte, wie KI-Agenten kooperativ an einem großen Projekt arbeiten können. Diesem Ziel ist er mit dem Projekt ein wenig nähergekommen.

Zunächst konnten sich die Agenten nicht einmal koordinieren, mit einem Locking-Mechanismus kamen sie nicht klar oder ignorierten ihn teils einfach. Lins Lösung: Er führte eine Hierarchie ein, bei der einige Agenten als Planer arbeiten und Aufgaben erstellen. Die wiederum schnappen sich Arbeiter, um sie zu bearbeiten.

Wie gut und sinnvoll der Code ist, ist angesichts des schieren Umfangs schwer zu bewerten. In einigen zufällig ausgewählten Dateien fielen uns viele Funktionen auf, die lediglich nach Wrapper-Code aussahen – die vielen Code-Zeilen könnten also irreführend sein.

Aus Lins Blogpost geht hingegen hervor, dass viel Experimentieren erforderlich war, um überhaupt halbwegs effizient Code generiert zu bekommen: Wie viel Struktur ist erforderlich, welches Modell funktioniert am besten?

Auch das Formulieren gut funktionierender Prompts ist, wenig verwunderlich, eine Herausforderung. Ob daraus tatsächlich einmal eine echte Konkurrenz für menschliche Teams wird, lässt sich derzeit aber nicht abschätzen. Bild- und Videogeneratoren haben gezeigt, dass in kurzer Zeit enorme Fortschritte möglich sind. Dass sich das auf Code-Generierung übertragen lässt, ist aber alles andere als klar.


Relevante Themen