Diese Woche dasselbe Gespräch zum dritten Mal. Drei verschiedene Unternehmen, drei verschiedene KI-Lösungsanbieter, am Ende dieselbe Diagnose. Es liegt nicht an der KI.

Die Frage, die zu selten vor dem Piloten gestellt wird: Was darf dieser Agent eigentlich allein entscheiden? Foto: Vlada Karpovich auf Pexels
Dreimal dieselbe Diagnose
Letzte Woche. Eine Marketingleiterin aus dem B2B-Bereich, ihr Unternehmen betreibt seit drei Monaten einen KI-Agenten zur Vorqualifizierung eingehender Kundenanfragen. Technisch funktioniert er. Nur: Jede Ausgabe wird von zwei Personen geprüft, weil vor dem Start nie entschieden wurde, was der Agent allein abschließen darf.
Konkret heißt das: Eine einfache Anfrage zu Lieferzeiten, niedriges Risiko, klare Antwort, durchläuft denselben Freigabeprozess wie eine Anfrage zu einer Auftragsänderung mit Preiskonsequenzen. Das Team verbringt inzwischen mehr Zeit mit dem Review als vorher mit der manuellen Bearbeitung. Sie überlegen, den Agenten abzuschalten.
Das höre ich in drei von vier Gesprächen über laufende KI-Agenten-Piloten. Nicht: die Technologie funktioniert nicht. Sondern: wir wissen nicht, was wir ihr erlauben sollen, also kontrollieren wir alles. Der Agent läuft, aber er entlastet niemanden.
Die Prognose, die kaum jemand zitiert
Gartner hat am 26. Mai in einer Pressemitteilung explizit davor gewarnt: „Applying Uniform Governance Across AI Agents Will Lead to Enterprise AI Agent Failure.” Übersetzt heißt das: Wer für einen Terminplanungs-Bot und einen autonomen Einkaufsagenten dieselben Freigabeprozesse verwendet, scheitert systematisch. Entweder bremst er einfache Agenten durch zu viele Approval-Stufen aus, oder er gibt komplexen Agenten zu viel Spielraum, weil die Kontrollen nicht für ihren Autonomiegrad ausgelegt wurden.
Eine Erhebung von Forrester und Anaconda aus diesem Jahr setzt noch eins drauf: 88 Prozent aller KI-Agenten-Piloten schaffen die Produktionsreife nie. Die am häufigsten genannten Gründe: Governance-Reibung, fehlende Evaluierungsstandards, keine klare Entscheidungsarchitektur.
Die Ironie dabei: Die Projekte, die durchkommen, erzielen laut Analystendaten im Schnitt einen ROI von 171 Prozent. Das Potenzial ist real. Die Umsetzungsquote ist es nicht.
88 Prozent der KI-Agenten-Piloten schaffen die Produktionsreife nie. Nicht wegen der Technologie, weil niemand vorab entschieden hat, was der Agent allein darf.
Zwei Stunden Arbeit, die drei Monate sparen
Ich empfehle jedem Unternehmen, das gerade einen Piloten startet oder in einem feststeckt, eine simple Übung vor dem nächsten technischen Schritt. Beantwortet drei Fragen schriftlich: Was darf der Agent allein entscheiden? Was darf er vorbereiten, aber nicht finalisieren? Was soll er immer eskalieren?
Das klingt selbstverständlich. In der Praxis wird es fast nie vor dem Start gemacht, weil die Energie in Technologieauswahl und API-Integration fließt, nicht in Entscheidungsarchitektur. Die Teams, die ich kenne und die ihre Piloten erfolgreich in Produktion gebracht haben, haben alle dasselbe gemeinsam: Dieses Dokument existiert. Es hat maximal zwei Seiten.
Alles, was sich nicht eindeutig einer Seite zuordnen lässt, kommt unter „immer menschliche Prüfung”, bis echte Betriebsdaten zeigen, wie der Agent in diesem Bereich performt. Das ist kein Rückschritt in der Automatisierung, das ist die Voraussetzung dafür, dass sie stabil läuft.
Die Frage, die niemand stellt
Was mich an der aktuellen KI-Agenten-Debatte nervt: Sie dreht sich fast ausschließlich um Technologie. Welches Modell, welches Framework, welche Orchestrierungsschicht? Das sind legitime Fragen, aber sie sind die falschen, solange noch keine Antwort auf die Grundfrage steht, was dieser Agent die Erlaubnis hat, eigenständig zu entscheiden.
Wenn die Antwort „noch nicht ganz klar” ist, scheitert das beste Modell der Welt, nicht weil es falsch rechnet, sondern weil die Organisation nicht weiß, wie sie mit seinen Ausgaben umgehen soll.
Ich habe auch meinen Anteil daran. Wir bei Collective Brain haben Piloten begleitet, bei denen die Governance-Frage zu spät gestellt wurde. Das Ergebnis war immer dasselbe: Ein Agent, der technisch liefert, aber organisatorisch nicht landet. Wir fangen heute damit an, bevor wir die erste API anfassen.