89 Prozent in zwei Händen. Was diese Woche euren KI-Stack neu definiert

Ich saß diese Woche bei einem Kunde-Call mit einem Maschinenbauer aus Niedersachsen, der mir stolz erzählte: „Wir haben jetzt einen Vendor-Vertrag mit OpenAI.” Mein Kommentar war ein Satz: „Was ist Ihr Plan B?” Drei Sekunden Stille, dann das ehrliche Eingeständnis: „Den haben wir nicht.” Drei Tage später lieferte The Information die Zahl, die meinen Reflex statistisch unterfütterte.

Server in einem Rechenzentrum in blauem Licht, Symbolbild für KI-Infrastruktur und den Anthropic-OpenAI-Stack

89 Prozent aller KI-Startup-Umsätze landen bei zwei US-Firmen. Wer jetzt seinen Mittelstand-Stack baut, baut auf einem Duopol. Foto: panumas nikhomkhai auf Pexels

Mein Take: Anthropic und OpenAI haben den KI-Markt diese Woche endgültig zum Duopol gemacht. Mit 89 Prozent der Startup-Umsätze, einem Anthropic, der erstmals operativ schwarz schreibt, und einem „Claude for Small Business”-Paket mit 15 vorgefertigten Agenten ist klar: Eure Architektur-Entscheidung der nächsten 30 Tage entscheidet, ob ihr KI-Konsumenten oder KI-Bauherren werdet. Wer jetzt monolithisch auf einen Anbieter setzt, baut sich freiwillig ein Vendor-Lock-in für die nächsten fünf Jahre.

Was The Information diese Woche dokumentiert hat

Die Zahl ist sauber recherchiert, das macht sie unbequem. The Information hat in dieser Woche die Umsätze von 34 führenden KI-Startups ausgewertet: knapp 80 Milliarden Dollar Jahresumsatz, ein Plus von 112 Prozent in nur sechs Monaten. Von diesen 80 Milliarden gehen 89 Prozent an zwei Firmen: Anthropic und OpenAI. Anthropic liegt mit 34,4 Prozent Marktanteil vorne, OpenAI bei 32,3 Prozent. Der Rest der Branche, also Mistral, Cohere, Aleph Alpha, Perplexity und alle deutschen und europäischen Anbieter zusammengenommen, teilt sich die restlichen elf Prozent.

Anthropic meldete für das zweite Quartal 2026 einen Umsatz von 10,9 Milliarden Dollar (+130 Prozent gegenüber dem Vorquartal) und einen operativen Gewinn von 559 Millionen Dollar. Das ist die erste Profitabilität in der Geschichte der Firma. Parallel hat Anthropic „Claude for Small Business” gelauncht. Das Paket bringt 15 vorgefertigte Agenten mit, die direkt an QuickBooks, HubSpot und Canva andocken. Microsoft hat am 7. Mai zusätzlich Word, Excel und PowerPoint für Anthropics Claude geöffnet. Das war ein bemerkenswerter strategischer Schritt: Microsoft entkoppelt sich erkennbar von der reinen OpenAI-Exklusivität.

Warum 89 Prozent keine Statistik ist, sondern eine Architektur-Entscheidung

Hand aufs Herz: Ich höre seit zwölf Monaten in jedem Mittelstand-Pitch denselben Satz. „Wir nutzen ChatGPT.” Punkt. Kein zweiter Anbieter, kein Routing-Layer, kein Open-Weight-Fallback. Wenn ich frage, warum, kommt meistens: „Das Team hat sich daran gewöhnt.” Das ist der teuerste Satz im deutschen Mittelstand 2026.

Die 89-Prozent-Zahl ist deshalb keine Marktbeobachtung, sondern eine Warnung. Wenn ein Markt diese Konzentration erreicht, gilt: Preisanpassungen, API-Veränderungen, Data-Retention-Regeln und Output-Filter werden von zwei Anbietern diktiert. Beide sitzen in den USA, beide unterliegen dem CLOUD Act, beide haben in den letzten zwölf Monaten ihre Preise mindestens einmal merklich angehoben. Wer jetzt einen monolithischen Stack baut, schreibt sich einen Vendor-Vertrag, dessen Verhandlungsmacht in fünf Jahren komplett auf der anderen Seite des Tisches liegt.

89 Prozent ist keine Marktbeobachtung, sondern eine Warnung: Eure Verhandlungsmacht ist verkauft, bevor ihr den ersten Use-Case live habt.

Was die 11 Prozent eigentlich bedeuten und wie ihr sie nutzt

Die elf Prozent, die nicht bei Anthropic oder OpenAI liegen, klingen klein. In der Praxis sind sie euer wichtigster Hebel. Mistral Medium 3.5 als Open-Weight-Modell, Llama 4 von Meta, DeepSeek V3.5 aus China, dazu spezialisierte Anbieter wie Voyage AI für Embeddings oder Groq für extrem schnelle Inferenz: Das ist kein Restmarkt, das ist eure strategische Reserve.

Bei einem unserer Kunden, einem Industriedienstleister aus dem Ruhrgebiet, haben wir vor sechs Wochen einen einfachen Routing-Layer eingebaut. Standard-Anfragen für Vertriebs-E-Mails gehen an Claude (gute deutsche Sprachqualität), Kalkulations-Aufgaben an OpenAI (besseres Excel-Verständnis), interne Dokumentenanalyse gegen ein lokales Mistral-Modell auf einer Hetzner-VM (DSGVO-konformer, keine Datenexfiltration). Der Effekt nach sechs Wochen: 28 Prozent niedrigere monatliche KI-Kosten, eine deutlich saubere DSGVO-Dokumentation und, was niemand erwartet hatte, eine bessere Output-Qualität, weil jede Anfrage das passende Modell trifft.

Praktischer Hebel: Ein simpler Routing-Layer (LiteLLM, OpenRouter oder selbstgebaut in 200 Zeilen Python) reicht aus, um euren Stack vom Duopol zu entkoppeln. Das ist keine Architektur-Olympiade, das ist eine Woche Arbeit für einen erfahrenen Backend-Entwickler.

Drei Hebel, die ihr in den nächsten 30 Tagen ziehen müsst

Hebel 1: Inventarisiert eure KI-Vertragslage. Welche Anbieter habt ihr im Einsatz? Welche Verträge laufen wann aus? Welche Datenklassen gehen wohin? Diese Liste fehlt in 90 Prozent der Mittelstand-Marketing-Abteilungen, mit denen wir reden. Ohne diese Liste könnt ihr keine strategischen Entscheidungen treffen. Eine Excel-Tabelle reicht. Bitte nicht über-engineeren.

Hebel 2: Einen zweiten Anbieter dazuholen. Wenn euer Stack heute zu 100 Prozent auf OpenAI läuft, fügt Anthropic dazu. Oder umgekehrt. Egal welcher Reihenfolge, aber bitte diese Woche. Beide Anbieter haben kostenlose Trial-Tiers, die für einen Vergleichs-Test reichen. Nehmt fünf eurer häufigsten Prompts und lasst sie parallel laufen. Allein dieser Vergleichs-Test bringt euch eine fundierte zweite Meinung und macht euch sichtbar unabhängiger.

Hebel 3: Open-Weight-Fallback ausprobieren. Mistral Medium 3.5, Llama 4 oder DeepSeek V3.5 auf einer EU-Cloud (Hetzner, Open Telekom Cloud, Scaleway) für eure DSGVO-kritischsten Use-Cases. Das ist keine technische Heldentat mehr, das ist 2026 ein Tageswerk. Wir bei CB nutzen Open-Weight-Modelle für jeden Use-Case, in dem Kundendaten oder personenbezogene Daten verarbeitet werden. Nicht weil es trendig ist, sondern weil es die einzige saubere DSGVO-Antwort ist, die nicht von einer US-Privacy-Policy abhängt.

Die unbequeme Wahrheit

Und jetzt der Teil, den ich mir selbst nicht erspare: Wir bei Collective Brain haben in den letzten 18 Monaten ebenfalls zu lange auf einen Hauptanbieter gesetzt. Erst seit März 2026 fahren wir konsequent dreigleisig. Die Umstellung hat zwei Wochen Aufwand gekostet und einen achtstündigen Workshop mit dem Team, um neue Prompt-Standards zu definieren. Mehr nicht. Wir hätten das auch schon 2025 machen können. Es war ein Fehler, dass wir damit gewartet haben.

Der ehrliche Punkt: Bequemlichkeit kostet im KI-Stack mehr als jede zweite Lizenz. Wer 2026 noch monolithisch auf OpenAI oder Anthropic setzt, zahlt diesen Komfort 2027 mit Verhandlungsmacht. Das ist keine ideologische Position, das ist eine nüchterne Risiko-Rechnung.

In zwei Sätzen: Anthropic und OpenAI haben mit 89 Prozent der KI-Startup-Umsätze diese Woche bewiesen, dass der KI-Markt ein US-Duopol ist. Wer in den nächsten 30 Tagen kein zweites Modell, keinen Routing-Layer und keinen Open-Weight-Fallback hat, hat seinen Mittelstand-Stack freiwillig in Anhängigkeit verkauft.
Florian Wessling, CEO, Collective Brain GmbH · Hamburg
Florian Wessling
CEO, Collective Brain GmbH · Hamburg

Florian Wessling ist CEO der Collective Brain GmbH in Hamburg und berät seit über 15 Jahren deutsche Mittelständler bei Brand, Content-Strategie und KI-gestütztem Marketing. Er hat bisher rund 200 BAFA-geförderten Mittelstands-Projekten zu skalierbaren Content- und Personenmarken-Pipelines verholfen und gilt als prononcierter Stimme zu Creator-Economy und KI-Marketing für den deutschen B2B-Mittelstand.