Montagmorgen, Kaffee noch nicht ganz durch, und ich lese die Zahl zum dritten Mal, weil ich sie beim ersten Mal nicht glauben wollte. Uber hat sein komplettes KI-Budget für 2026 in vier Monaten verbrannt. Dann habe ich unsere eigene Rechnung aufgemacht.

Das Uber-Logo auf dem Dach ist diese Woche zum Symbol für eine Kostenexplosion geworden, die niemand kommen sah. Foto: Aleksandr Sochnev auf Pexels
Die Zahl, die mich hat schlucken lassen
CTO Praveen Neppalli Naga hat es gegenüber The Information bestätigt: Uber ist mit seinem kompletten 2026er-KI-Budget zurück am Reißbrett. Der Grund war Claude Code, verteilt an ungefähr 5.000 Ingenieure, mit monatlichen Kosten zwischen 500 und 2.000 Dollar pro Power-User. Bei Autocomplete verbraucht ein Ingenieur einen Bruchteil dessen, was jemand verbraucht, der parallele Agenten über ein ganzes Monorepo orchestrieren lässt. Uber hat beides gemischt ausgerollt, ohne Deckel, und dazu noch interne Leaderboards geführt, auf denen Ingenieure nach Claude-Code-Nutzung gerankt wurden. Wer oben stehen wollte, hat mehr Token verbraucht. Das Ergebnis war innerhalb eines Quartals sichtbar.
Fast zeitgleich hat GitHub am 1. Juni die Flatrate für Copilot beendet. Jeder Plan läuft jetzt über ein Guthaben aus AI Credits, verbraucht nach Token. Entwickler berichten von Rechnungen, die von 29 auf 750 Euro springen, von 50 auf 3.000, in einzelnen agentischen Workflows noch höher. Zwei völlig unterschiedliche Firmen, dasselbe Muster: Sobald KI vom Zuarbeiter zum Agenten wird, der selbstständig Schritte ausführt, wächst der Verbrauch nicht linear, sondern in Sprüngen, die vorher niemand eingeplant hatte.
Warum das kein Uber-Problem ist
Bei uns in der Agentur laufen seit März zwei Entwickler mit Claude Code an internen Tools. Ich hatte die Rechnung nie genauer angeschaut, weil sie klein war. Nach der Uber-Meldung habe ich sie mir tatsächlich vorgenommen und den Verlauf der letzten zwölf Wochen durchgesehen. Kein Uber-Ausmaß, aber die Kurve zeigt genau dieselbe Form: flach, flach, flach, und dann ein Sprung in der Woche, in der einer der beiden anfing, mehrere Agenten parallel an einem Refactoring arbeiten zu lassen.
Bei einem Kunden von uns, einem Softwarehaus mit vierzig Entwicklern, lief es letzte Woche fast identisch. Er hatte Cursor mit Agentenfunktion für das ganze Team freigeschaltet, ohne Obergrenze, weil die Einzelpreise ja gerade fallen. Als die erste Monatsrechnung kam, war sie mehr als das Sechsfache dessen, was er kalkuliert hatte. Nicht weil das Modell teurer geworden wäre. Sondern weil vier Entwickler angefangen hatten, Agenten über Nacht laufen zu lassen, während sie schliefen.
Ein Preisverfall pro Token schützt dich nicht vor einer Kostenexplosion, wenn niemand den Gesamtverbrauch deckelt.
Was ich bei uns diese Woche geändert habe
Drei Dinge, alle vor dem nächsten Rollout, nicht danach wie bei Uber.
Erstens: eine harte monatliche Obergrenze pro Nutzer und Tool, festgelegt bevor jemand den Zugang bekommt, nicht nachdem die Rechnung da war. Uber hat genau das jetzt eingeführt, 1.500 Dollar pro Monat und Tool. Ich finde richtig daran nur die Reihenfolge falsch. Das gehört an den Anfang.
Zweitens: keine internen Vergleiche, die rohen Verbrauch belohnen. Uber hatte Leaderboards nach Token-Nutzung. Wir messen bei uns jetzt, wie viel Zeit ein Tool tatsächlich spart und ob der Output ohne Nacharbeit nutzbar ist, nicht wie viele Anfragen jemand stellt.
Drittens: Autocomplete und agentische Nutzung getrennt behandeln. Ein Entwickler, der sich Codevorschläge anzeigen lässt, kostet fast nichts. Einer, der mehrere Agenten parallel über Nacht Aufgaben abarbeiten lässt, kostet ein Vielfaches. Wer beides im selben Budget-Topf führt, merkt den Unterschied erst, wenn es zu spät ist.
Der unbequeme Teil
Wir hätten bei uns fast denselben Fehler gemacht wie Uber, nur kleiner. Sechs Wochen lang hat niemand die Rechnung wirklich gelesen, weil die Zahl unauffällig war. Erst ein fremdes Debakel hat mich dazu gebracht, unsere eigene anzuschauen. Das ist der Teil, der mir nicht gefällt: Governance ist selten das Ergebnis von Weitsicht. Meistens ist es die Reaktion auf die Rechnung eines anderen.
Der Fix, den ich diese Woche eingeführt habe, ist auch nicht spektakulär. Eine Tabelle, ein wöchentlicher Kalendereintrag, zwei Zahlen, die ich mir ansehe. Kein neues Tool, keine Beratung, kein Framework. Genau das ist der Punkt. Kostenkontrolle bei KI-Agenten ist langweilig, und sie funktioniert nur, wenn sie langweilig bleibt, also regelmäßig und ohne Ausnahme, statt einmal groß und dann nie wieder.