Magazin

Das Problem mit eurem KI-Agenten-Projekt ist nicht die KI

Diese Woche dasselbe Gespräch zum dritten Mal. Drei verschiedene Unternehmen, drei verschiedene KI-Lösungsanbieter, am Ende dieselbe Diagnose. Es liegt nicht an der KI.

Gestresste Frau zwischen zwei Kollegen in einem Bürobesprechungsraum

Die Frage, die zu selten vor dem Piloten gestellt wird: Was darf dieser Agent eigentlich allein entscheiden? Foto: Vlada Karpovich auf Pexels

Mein Take: Gartner hat Ende Mai auf Basis von mehr als 3.400 befragten Organisationen eine Prognose veröffentlicht, die kaum jemand zitiert: 40 Prozent aller Enterprise-KI-Agenten-Projekte werden bis Ende 2027 demontiert oder eingestellt. Die Hauptursache ist laut Gartner keine Technologie, kein Budget, keine schlechten Daten. Es ist Governance, also das Fehlen einer klaren Entscheidung, was ein Agent allein tun darf und was nicht. Ich sehe dieses Problem gerade in jedem zweiten Kundengespräch. Und die Lösung braucht kein Framework, kein neues Modell, keine externe Beratung. Sie braucht zwei Stunden und ein Blatt Papier.

Dreimal dieselbe Diagnose

Letzte Woche. Eine Marketingleiterin aus dem B2B-Bereich, ihr Unternehmen betreibt seit drei Monaten einen KI-Agenten zur Vorqualifizierung eingehender Kundenanfragen. Technisch funktioniert er. Nur: Jede Ausgabe wird von zwei Personen geprüft, weil vor dem Start nie entschieden wurde, was der Agent allein abschließen darf.

Konkret heißt das: Eine einfache Anfrage zu Lieferzeiten, niedriges Risiko, klare Antwort, durchläuft denselben Freigabeprozess wie eine Anfrage zu einer Auftragsänderung mit Preiskonsequenzen. Das Team verbringt inzwischen mehr Zeit mit dem Review als vorher mit der manuellen Bearbeitung. Sie überlegen, den Agenten abzuschalten.

Das höre ich in drei von vier Gesprächen über laufende KI-Agenten-Piloten. Nicht: die Technologie funktioniert nicht. Sondern: wir wissen nicht, was wir ihr erlauben sollen, also kontrollieren wir alles. Der Agent läuft, aber er entlastet niemanden.

Die Prognose, die kaum jemand zitiert

Gartner hat am 26. Mai in einer Pressemitteilung explizit davor gewarnt: „Applying Uniform Governance Across AI Agents Will Lead to Enterprise AI Agent Failure.” Übersetzt heißt das: Wer für einen Terminplanungs-Bot und einen autonomen Einkaufsagenten dieselben Freigabeprozesse verwendet, scheitert systematisch. Entweder bremst er einfache Agenten durch zu viele Approval-Stufen aus, oder er gibt komplexen Agenten zu viel Spielraum, weil die Kontrollen nicht für ihren Autonomiegrad ausgelegt wurden.

Eine Erhebung von Forrester und Anaconda aus diesem Jahr setzt noch eins drauf: 88 Prozent aller KI-Agenten-Piloten schaffen die Produktionsreife nie. Die am häufigsten genannten Gründe: Governance-Reibung, fehlende Evaluierungsstandards, keine klare Entscheidungsarchitektur.

Die Ironie dabei: Die Projekte, die durchkommen, erzielen laut Analystendaten im Schnitt einen ROI von 171 Prozent. Das Potenzial ist real. Die Umsetzungsquote ist es nicht.

88 Prozent der KI-Agenten-Piloten schaffen die Produktionsreife nie. Nicht wegen der Technologie, weil niemand vorab entschieden hat, was der Agent allein darf.

Zwei Stunden Arbeit, die drei Monate sparen

Ich empfehle jedem Unternehmen, das gerade einen Piloten startet oder in einem feststeckt, eine simple Übung vor dem nächsten technischen Schritt. Beantwortet drei Fragen schriftlich: Was darf der Agent allein entscheiden? Was darf er vorbereiten, aber nicht finalisieren? Was soll er immer eskalieren?

Das klingt selbstverständlich. In der Praxis wird es fast nie vor dem Start gemacht, weil die Energie in Technologieauswahl und API-Integration fließt, nicht in Entscheidungsarchitektur. Die Teams, die ich kenne und die ihre Piloten erfolgreich in Produktion gebracht haben, haben alle dasselbe gemeinsam: Dieses Dokument existiert. Es hat maximal zwei Seiten.

Alles, was sich nicht eindeutig einer Seite zuordnen lässt, kommt unter „immer menschliche Prüfung”, bis echte Betriebsdaten zeigen, wie der Agent in diesem Bereich performt. Das ist kein Rückschritt in der Automatisierung, das ist die Voraussetzung dafür, dass sie stabil läuft.

Praktischer Hebel: Macht für euren KI-Agenten eine zweispaltige Tabelle. Links: Tasks, die er allein abschließt. Rechts: Tasks, die immer einen Menschen brauchen. Alles, was ihr nicht eindeutig zuordnen könnt, kommt rechts. Das ist eure Governance-Architektur. Sie passt auf ein Blatt Papier und ist das Erste, was ihr braucht, bevor ihr das Modell wechselt.

Die Frage, die niemand stellt

Was mich an der aktuellen KI-Agenten-Debatte nervt: Sie dreht sich fast ausschließlich um Technologie. Welches Modell, welches Framework, welche Orchestrierungsschicht? Das sind legitime Fragen, aber sie sind die falschen, solange noch keine Antwort auf die Grundfrage steht, was dieser Agent die Erlaubnis hat, eigenständig zu entscheiden.

Wenn die Antwort „noch nicht ganz klar” ist, scheitert das beste Modell der Welt, nicht weil es falsch rechnet, sondern weil die Organisation nicht weiß, wie sie mit seinen Ausgaben umgehen soll.

Ich habe auch meinen Anteil daran. Wir bei Collective Brain haben Piloten begleitet, bei denen die Governance-Frage zu spät gestellt wurde. Das Ergebnis war immer dasselbe: Ein Agent, der technisch liefert, aber organisatorisch nicht landet. Wir fangen heute damit an, bevor wir die erste API anfassen.

In zwei Sätzen: Gartner prognostiziert, dass 40 Prozent aller KI-Agenten-Projekte bis 2027 abgebrochen werden, wegen fehlender Governance-Architektur, nicht Technologieversagen. Wer vor dem Piloten schriftlich festhält, was der Agent allein darf und was nicht, hat eine reale Chance; wer diese Frage technischen Defaults überlässt, beantwortet sie durch Failure im Betrieb.
Florian Wessling, CEO, Collective Brain GmbH · Hamburg
CEO, Collective Brain GmbH · Hamburg

Florian Wessling ist CEO der Collective Brain GmbH in Hamburg und berät seit über 15 Jahren Mittelständler und Konzerne bei Brand, Content-Strategie und KI-gestütztem Marketing. Er ist eingetragener BAFA-Berater und führt mit Collective Brain eine Google-Partner-Agentur. Florian gilt als prononcierte Stimme zu Creator-Economy und KI-Marketing im deutschen B2B-Markt.