Vor einem halben Jahr saß ein Kunde bei mir, Großhändler, seit dreißig Jahren im Geschäft, und sagte einen Satz, den ich seitdem ständig höre. „Im Test ist die KI super. Aber wenn ich das auf alle Produkttexte loslasse, frisst sie mir die Marge.” Er hatte recht. Damals. Diese Woche ist sein Argument um drei Viertel geschrumpft, und er weiß es noch nicht.

von Florian Wessling·31. Mai 2026, 08:30 Uhr · Lesezeit: ca. 5 Minuten

Nahaufnahme von Prozessor und Arbeitsspeicher-Riegeln, der Hardware, auf der die KI-Modelle laufen, deren Preise gerade abstürzen

Der Preis pro Million Token ist die langweiligste Zahl der Branche. Und die, die diese Woche am lautesten gefallen ist. Foto: Marta Branco auf Pexels

Mein Take: Alle starren auf die nächste Benchmark-Tabelle. Das eigentliche Ereignis der Woche steht im Kleingedruckten der Preislisten: KI ist über Nacht 75 Prozent billiger geworden. Damit fällt die Ausrede, mit der die meisten Unternehmer KI bisher vertagt haben. Gut für dich. Der Haken kommt trotzdem, und er ist unbequemer als der Preis je war.

Die Zahl, auf die keiner geschaut hat

Die Schlagzeilen gehörten mal wieder den Benchmarks. Wer rechnet schneller, wer löst die kniffligeren Coding-Aufgaben, wer steht in welcher Tabelle oben. Mich hat eine andere Zahl interessiert, die fast keiner gemeldet hat.

DeepSeek hat den 75-Prozent-Rabatt auf sein Flaggschiff V4-Pro dauerhaft gemacht. Befristet war er bis Ende Mai, jetzt ist er der Normalpreis. In Zahlen: Beim Start im April kostete eine Million Input-Token 1,74 Dollar, eine Million Output-Token 3,48 Dollar. Seit dieser Woche sind es dauerhaft 0,44 und 0,87 Dollar. Die Computerwoche hat es „Verschärfung des KI-Preiskriegs” genannt, und das trifft es.

Google hat keine Woche gebraucht, um zu kontern. Auf der I/O kam Gemini 3.5 Flash, ausdrücklich als günstiges, schnelles Modell für Agenten und Routine-Arbeit. Wenn der billigste Anbieter den Preis viertelt und der größte sofort mit einem Spar-Modell antwortet, ist das kein Zufall. Das ist ein Preiskampf. Und der Gewinner heißt: jeder, der KI einkauft.

Deine Rechnung von letztem Jahr stimmt nicht mehr

Zurück zu meinem Großhändler. Er hatte keinen Denkfehler. Seine Rechnung war für November korrekt. Zehntausend Produkttexte über ein Premium-Modell zu jagen, war eine Investition, die man begründen musste. Heute ist dieselbe Aufgabe ein Posten, den du in der Portokasse überlesen würdest.

Das ist das Muster, das mir bei Unternehmern ständig begegnet. Sie haben irgendwann eine saubere Entscheidung gegen KI getroffen, auf Basis von Preisen, die heute nicht mehr existieren. Und sie fassen diese Entscheidung nie wieder an. Aus dem „rechnet sich nicht” von damals ist eine Haltung geworden, obwohl der Boden darunter längst weg ist.

Viele entscheiden gegen KI auf Basis von Preisen, die ein halbes Jahr später nicht mehr existieren. Und schauen nie wieder hin.

Dazu eine Zahl, die das einordnet: Microsoft hat Mitte des Monats gemeldet, dass Deutschland erstmals über 30 Prozent KI-Nutzung liegt, von 28,6 auf 31,1 Prozent der Erwerbsfähigen im ersten Quartal. Weltweit sind es 17,8. Wir sind also nicht die Nachzügler, für die wir uns gern halten. Aber benutzen ist nicht dasselbe wie Geld damit verdienen. Genau dazwischen liegt die Lücke, in der die meisten Unternehmen gerade stehen.

Was ich an deiner Stelle diese Woche täte

Drei Dinge, keines kostet nennenswert Geld. Das ist diese Woche der ganze Punkt.

Hol die Liste der abgesagten Ideen raus. Jede Firma hat sie, meistens im Kopf des Chefs: die KI-Projekte, die man „aus Kostengründen” geschoben hat. Massen-Produkttexte, automatische Angebots-Entwürfe, mehrsprachige Varianten, Shop-Bildbeschreibungen. Rechne genau die mit den heutigen Token-Preisen neu. Bei den meisten kippt das Ergebnis von rot auf schwarz, ohne dass du an der Idee selbst irgendwas geändert hast.

Trenne dabei Routine von Kür. Du musst nicht jede Aufgabe ans teuerste Modell geben. Billiger werden vor allem die schnellen Modelle, und für den Großteil der Marketing-Routine reichen die locker. Das gute Modell hebst du dir für die Handvoll Aufgaben auf, bei denen Qualität wirklich Umsatz bringt. Wer das sauber trennt, halbiert seine Kosten ein zweites Mal.

Und verlass dich nicht auf einen einzigen Anbieter. Dass DeepSeek den Preis drückt und Google sofort kontert, ist gut für dein Budget. Es heißt aber auch: Der Billigste von heute ist morgen ein anderer. Bau deine Abläufe so, dass du das Modell tauschen kannst, ohne den halben Prozess neu aufzusetzen.

Der Haken, den der niedrige Preis nicht löst

Jetzt der Teil, der mir selbst nicht schmeckt. Sinkende Preise lösen kein einziges der Probleme, über die ich hier seit Wochen schreibe. Wenn dein Team bisher ohne klares Briefing, ohne festes Output-Format und ohne Erfolgsmessung mit KI gearbeitet hat, dann produziert es ab jetzt einfach mehr vom selben Mittelmaß, nur zum Spottpreis. Billige Token sind ein Verstärker, kein Korrektiv.

Ich merke das bei uns in der Agentur selbst. Der niedrige Preis verführt dazu, einfach mehr laufen zu lassen, statt besser zu briefen. Das ist die eigentliche Gefahr dieser Woche: dass die verschwundene Kosten-Ausrede uns die Disziplin-Frage vergessen lässt. Der Preis war nie das Hindernis. Er war die bequemste Begründung, sich nicht damit zu beschäftigen.

In zwei Sätzen: Der Preiskrieg dieser Woche nimmt dir das letzte Kosten-Argument gegen KI, im Skalieren kostet sie kaum noch etwas. Wer jetzt seine alte Nein-Liste neu durchrechnet, gewinnt, wer ohne klare Regeln einfach mehr laufen lässt, bezahlt nur weniger fürs gleiche Mittelmaß.

Florian Wessling

CEO, Collective Brain GmbH · Hamburg

Florian Wessling ist CEO der Collective Brain GmbH in Hamburg und bringt seit über 15 Jahren Marken, Content-Strategie und KI-gestütztes Marketing in Mittelstand und Konzerne. Was Collective Brain verkauft, betreibt er zuerst selbst: Sechs eigene KI-Marken dienen als Testfeld, von der automatisierten Content-Pipeline bis zum täglich aktualisierten AI Leaderboard. Er ist eingetragener BAFA-Berater und führt mit Collective Brain eine Google-Partner-Agentur.

LinkedIn Beratung anfragen

Die KI-Ausrede, die diese Woche gestorben ist

Die Zahl, auf die keiner geschaut hat

Deine Rechnung von letztem Jahr stimmt nicht mehr

Was ich an deiner Stelle diese Woche täte

Der Haken, den der niedrige Preis nicht löst