Magazin

Uber hat sein KI-Budget für 2026 in vier Monaten verbrannt. Ich habe unsere Rechnung nachgeschaut.

Montagmorgen, Kaffee noch nicht ganz durch, und ich lese die Zahl zum dritten Mal, weil ich sie beim ersten Mal nicht glauben wollte. Uber hat sein komplettes KI-Budget für 2026 in vier Monaten verbrannt. Dann habe ich unsere eigene Rechnung aufgemacht.

Gelbes Uber-Taxi von oben fotografiert auf einer Stadtstraße

Das Uber-Logo auf dem Dach ist diese Woche zum Symbol für eine Kostenexplosion geworden, die niemand kommen sah. Foto: Aleksandr Sochnev auf Pexels

Mein Take: Uber hat laut The Information sein komplettes KI-Budget für 2026 schon im April aufgebraucht, weil rund 5.000 Ingenieure Claude Code schneller adaptiert haben, als die Finanzplanung vorgesehen hatte. Der Grund ist nicht der Preis pro Token, der fällt seit Monaten. Der Grund ist, dass niemand einen Deckel draufgesetzt hat, bevor der Verbrauch losging. Genau diesen Fehler sehe ich gerade häufiger bei kleineren Firmen als bei Uber, nur mit kleineren Zahlen und derselben Wucht.

Die Zahl, die mich hat schlucken lassen

CTO Praveen Neppalli Naga hat es gegenüber The Information bestätigt: Uber ist mit seinem kompletten 2026er-KI-Budget zurück am Reißbrett. Der Grund war Claude Code, verteilt an ungefähr 5.000 Ingenieure, mit monatlichen Kosten zwischen 500 und 2.000 Dollar pro Power-User. Bei Autocomplete verbraucht ein Ingenieur einen Bruchteil dessen, was jemand verbraucht, der parallele Agenten über ein ganzes Monorepo orchestrieren lässt. Uber hat beides gemischt ausgerollt, ohne Deckel, und dazu noch interne Leaderboards geführt, auf denen Ingenieure nach Claude-Code-Nutzung gerankt wurden. Wer oben stehen wollte, hat mehr Token verbraucht. Das Ergebnis war innerhalb eines Quartals sichtbar.

Fast zeitgleich hat GitHub am 1. Juni die Flatrate für Copilot beendet. Jeder Plan läuft jetzt über ein Guthaben aus AI Credits, verbraucht nach Token. Entwickler berichten von Rechnungen, die von 29 auf 750 Euro springen, von 50 auf 3.000, in einzelnen agentischen Workflows noch höher. Zwei völlig unterschiedliche Firmen, dasselbe Muster: Sobald KI vom Zuarbeiter zum Agenten wird, der selbstständig Schritte ausführt, wächst der Verbrauch nicht linear, sondern in Sprüngen, die vorher niemand eingeplant hatte.

Warum das kein Uber-Problem ist

Bei uns in der Agentur laufen seit März zwei Entwickler mit Claude Code an internen Tools. Ich hatte die Rechnung nie genauer angeschaut, weil sie klein war. Nach der Uber-Meldung habe ich sie mir tatsächlich vorgenommen und den Verlauf der letzten zwölf Wochen durchgesehen. Kein Uber-Ausmaß, aber die Kurve zeigt genau dieselbe Form: flach, flach, flach, und dann ein Sprung in der Woche, in der einer der beiden anfing, mehrere Agenten parallel an einem Refactoring arbeiten zu lassen.

Bei einem Kunden von uns, einem Softwarehaus mit vierzig Entwicklern, lief es letzte Woche fast identisch. Er hatte Cursor mit Agentenfunktion für das ganze Team freigeschaltet, ohne Obergrenze, weil die Einzelpreise ja gerade fallen. Als die erste Monatsrechnung kam, war sie mehr als das Sechsfache dessen, was er kalkuliert hatte. Nicht weil das Modell teurer geworden wäre. Sondern weil vier Entwickler angefangen hatten, Agenten über Nacht laufen zu lassen, während sie schliefen.

Ein Preisverfall pro Token schützt dich nicht vor einer Kostenexplosion, wenn niemand den Gesamtverbrauch deckelt.

Was ich bei uns diese Woche geändert habe

Drei Dinge, alle vor dem nächsten Rollout, nicht danach wie bei Uber.

Erstens: eine harte monatliche Obergrenze pro Nutzer und Tool, festgelegt bevor jemand den Zugang bekommt, nicht nachdem die Rechnung da war. Uber hat genau das jetzt eingeführt, 1.500 Dollar pro Monat und Tool. Ich finde richtig daran nur die Reihenfolge falsch. Das gehört an den Anfang.

Zweitens: keine internen Vergleiche, die rohen Verbrauch belohnen. Uber hatte Leaderboards nach Token-Nutzung. Wir messen bei uns jetzt, wie viel Zeit ein Tool tatsächlich spart und ob der Output ohne Nacharbeit nutzbar ist, nicht wie viele Anfragen jemand stellt.

Drittens: Autocomplete und agentische Nutzung getrennt behandeln. Ein Entwickler, der sich Codevorschläge anzeigen lässt, kostet fast nichts. Einer, der mehrere Agenten parallel über Nacht Aufgaben abarbeiten lässt, kostet ein Vielfaches. Wer beides im selben Budget-Topf führt, merkt den Unterschied erst, wenn es zu spät ist.

Praktischer Hebel: Bevor du dein Team mit Claude Code, Cursor oder Copilot mit Agentenfunktionen ausstattest, leg eine harte Obergrenze pro Nutzer und Monat fest, und prüf den Verbrauch in der ersten Woche, nicht erst im Quartalsbericht.

Der unbequeme Teil

Wir hätten bei uns fast denselben Fehler gemacht wie Uber, nur kleiner. Sechs Wochen lang hat niemand die Rechnung wirklich gelesen, weil die Zahl unauffällig war. Erst ein fremdes Debakel hat mich dazu gebracht, unsere eigene anzuschauen. Das ist der Teil, der mir nicht gefällt: Governance ist selten das Ergebnis von Weitsicht. Meistens ist es die Reaktion auf die Rechnung eines anderen.

Der Fix, den ich diese Woche eingeführt habe, ist auch nicht spektakulär. Eine Tabelle, ein wöchentlicher Kalendereintrag, zwei Zahlen, die ich mir ansehe. Kein neues Tool, keine Beratung, kein Framework. Genau das ist der Punkt. Kostenkontrolle bei KI-Agenten ist langweilig, und sie funktioniert nur, wenn sie langweilig bleibt, also regelmäßig und ohne Ausnahme, statt einmal groß und dann nie wieder.

In zwei Sätzen: Uber und GitHub Copilot zeigen dasselbe Muster: Sobald KI agentisch arbeitet, wächst der Verbrauch in Sprüngen, die kein sinkender Token-Preis abfedert. Wer vor dem Rollout eine harte Budgetgrenze setzt statt danach, zahlt für dieselbe Technologie einen Bruchteil.
Florian Wessling, CEO, Collective Brain GmbH · Hamburg
CEO, Collective Brain GmbH · Hamburg

Florian Wessling ist CEO der Collective Brain GmbH in Hamburg und berät seit über 15 Jahren Mittelständler und Konzerne bei Brand, Content-Strategie und KI-gestütztem Marketing. Er ist eingetragener BAFA-Berater und führt mit Collective Brain eine Google-Partner-Agentur. Florian gilt als prononcierte Stimme zu Creator-Economy und KI-Marketing im deutschen B2B-Markt.