Produktivität: KI-Projekte bringen 95 % der Firmen keinen messbaren Ertrag

Obwohl Unternehmen weltweit 30 bis 40 Milliarden US-Dollar in generative KI investiert haben, berichten 95 Prozent der Organisationen von null messbaren Erträgen. Das hat kürzlich eine MIT-Studie(öffnet im neuen Fenster) herausgefunden. Ein Forschungsteam von Betterup hat jetzt zusammen mit dem MIT Media Lab versucht herauszufinden, warum das so ist(öffnet im neuen Fenster) .
Demnach werden mit KI Arbeitsinhalte erzielt, die gut aussehen, aber oberflächlich und unvollständig sind und keinen echten Fortschritt bringen, was die Autoren als "Workslop" bezeichnen. Diese Dokumente verursachen in der Folge Mehrarbeit. Arbeit wird damit von der ursprünglichen Person auf den Empfänger verschoben – und erhöht damit den Gesamtaufwand statt ihn zu senken.
Gen-AI-Kluft zwischen Unternehmen
Die zwischen Januar und Juni 2025 durchgeführte Untersuchung des MIT-Projekts Nanda hatte rund 300 öffentliche KI-Implementierungen analysiert und 153 Führungskräfte aus allen Branchen befragt. Enterprise KI sind Lösungen, die von Unternehmen selbst aufgesetzt werden – im Gegensatz zu kommerziellen Alternativen wie ChatGPT oder Claude.
Die Forscher identifizierten eine GenAI-Kluft – eine Lücke zwischen den wenigen Unternehmen, die messbaren Nutzen aus KI-Tools ziehen, und der Mehrheit, die in endlosen Pilotphasen hängen bleibt. Nur fünf Prozent der integrierten KI-Pilotprojekte generieren aktuell messbaren Wert, während die meisten keinerlei Auswirkungen auf Gewinn- und Verlustrechnungen zeigen.
Consumer-Tools wie ChatGPT und Microsoft Copilot verzeichnen hohe Akzeptanzraten – rund 80 Prozent der Organisationen testen diese Plattformen, fast 40 Prozent führten sie bereits ein. Diese Tools steigern jedoch primär individuelle Produktivität, statt eine unternehmensweite Transformation zu bewirken.
Enterprise-KI-Systeme sind mit anderen Herausforderungen konfrontiert. Während 60 Prozent der Unternehmen maßgeschneiderte oder Anbieter-Tools evaluierten, erreichten nur 20 Prozent die Pilotphase und lediglich fünf Prozent den Produktivbetrieb. Die meisten Fehlschläge resultierten der Studie nach aus unflexiblen Workflows, begrenztem kontextuellem Lernen und mangelhafter Integration in bestehende Abläufe.
Lernlücke verhindert erfolgreiche Implementierung
Die Forschung identifizierte eine große Lernlücke als Haupthindernis für eine erfolgreiche KI-Einführung. Aktuelle GenAI-Systeme können den Studienautoren zufolge kein Feedback dauerhaft speichern, sich an organisatorische Kontexte anpassen oder ihre Leistung kontinuierlich verbessern. Nutzer wenden sich häufig von Enterprise-KI-Tools ab und bevorzugen die genannten Consumer-Alternativen – trotz erheblicher Unternehmensinvestitionen in spezialisierte Systeme.
Interviews offenbarten, dass dieselben Fachkräfte, die ChatGPT täglich privat nutzten, oft die internen KI-Implementierungen ihrer Unternehmen ablehnten. Eine für die Studie befragte Anwältin berichtete, dass das 50.000-Dollar-Vertragsanalyse-Tool ihres Unternehmens konstant schlechter abgeschnitten habe als ihr 20 US-Dollar teures ChatGPT-Abonnement.
Nachtrag vom 24. September 2025, 10:16 Uhr
Versehentlich haben wir heute gleich zwei Artikel zum Thema veröffentlicht. Dieser doppelt sich in weiten Teilen mit einer bereits Ende August bei Golem erschienen Meldung . Der Artikel zu der neuen Untersuchung ist hier zu finden.