In this article (4)
Das Fitnessstudio, in das niemand geht: Wie KI-Flatrate-Preise auf der Wette basieren, dass du nicht auftauchst
Key Takeaways
- Die KI-Pauschalpreisgestaltung basiert auf einer Annahme geringer Nutzung: Die Produktmarge hängt davon ab, dass die meisten Abonnenten das Produkt kaum nutzen.
- Variable Inferenzkosten bedeuten, dass intensive oder agentische KI-Nutzung einen Abonnenten von profitabel zu verlustbringend machen kann – ein strukturelles Risiko, dem traditionelles SaaS nie ausgesetzt war.
- Entwickler sollten die KI-Nutzung jetzt gegen den ARPU modellieren und eine nutzungsbasierte oder gestufte Preisgestaltung in Betracht ziehen, bevor die Nutzungsmuster die Pauschalgebührenannahmen überholen.
SaaS-Preisgestaltung ging von nahezu null Grenzkosten aus. KI tut das nicht. Diese Lücke zu verstehen ist gerade jetzt die wichtigste Lektion in der Tech-Wirtschaft.
SaaS-Preisgestaltung setzte nahezu null Grenzkosten voraus. KI tut das nicht. Diese Lücke zu verstehen ist gerade jetzt die wichtigste Lektion in der Tech-Wirtschaft.
Stell dir ein Fitnessstudio vor, das eine pauschale Monatsgebühr erhebt, dabei aber stillschweigend damit rechnet, dass die meisten Mitglieder nie auftauchen. Das Geschäftsmodell funktioniert wunderbar – bis zu dem Moment, an dem zu viele Menschen tatsächlich anfangen, die Laufbänder zu benutzen. Das ist keine Metapher für eine Fitnesskette. Es ist eine präzise Beschreibung, wie pauschale KI-Abonnements derzeit strukturiert sind – und wer das versteht, wird jede KI-Preisseite von nun an mit anderen Augen lesen.
Die Annahme hinter jeder Pauschale
Etwa vierzig Jahre lang basierte die Softwarepreisgestaltung auf einer grundlegenden Wahrheit: Einen weiteren Nutzer zu bedienen kostete so gut wie nichts. Wie Utpal Dholakia in „The Pricing Conundrum" schrieb, wurden nahezu alle Preisstrategien im Zusammenhang mit SaaS-Angeboten – von Abonnements pro Nutzer und kostenlosen Einstiegstarifen bis hin zu Mengenrabatten für große Unternehmenskunden – in einer Zeit entwickelt, als die Grenzkosten für einen zusätzlichen Nutzer nahezu null betrugen. Diese Annahme prägte, wie Gründer ihre Einheitswirtschaft modellierten, wie Investoren ARR bewerteten und wie Kunden lernten, was Software kosten sollte. Ein Vielnutzer und ein Gelegenheitsnutzer waren aus Sicht des Anbieters wirtschaftlich austauschbar. Pauschalen ergaben Sinn, weil die Kostenkurve flach war.
KI-Inferenz ist nicht flach. Jede Anfrage, jedes generierte Bild, jede agentische Aufgabe, die autonom im Auftrag eines Nutzers ausgeführt wird, verbraucht echte Rechenleistung, die direkt mit der tatsächlichen Nutzung skaliert. Laut der Analyse von RevenueCat zur Ökonomie von Abonnement-Apps führen KI-Funktionen variable Kosten ein, die mit der Nutzungsintensität steigen und damit das Modell der nahezu null Grenzkosten direkt aushebeln, auf dem traditionelle Abonnement-Apps aufgebaut wurden. Je mehr ein Abonnent das Produkt nutzt, desto mehr kostet es, ihn zu bedienen. Das ist strukturell das genaue Gegenteil davon, wie SaaS-Ökonomie konzipiert war.
Warum Anbieter Preise setzen, die sich gegen sie wenden können
Warum sollte ein rational handelndes Unternehmen ein Produkt auf diese Weise bepreisen? Die Antwort, wie Marc Nager in einer vielbeachteten Analyse der KI-Ökonomie auf LinkedIn festhielt, lautet: Die Kostenlast wird von den großen KI-Playern aktiv subventioniert. Brad Felds Formulierung, die in derselben Diskussion zitiert wird, bringt die strukturelle Spannung klar auf den Punkt: KI mag schneller sein, aber sie ist nicht günstiger – und unter der Preisgestaltung baut sich eine Schuld auf, die Verbraucher nicht sehen.
Pauschale Preisgestaltung ist keine Naivität. Es ist eine kalkulierte Wette darauf, dass die meisten Abonnenten das Produkt nur leicht nutzen und damit Einnahmen generieren, die die Minderheit der Vielnutzer quersubventionieren. Das funktioniert – bis sich die Nutzungsmuster verschieben.
Die Verschiebung ist bereits sichtbar. Agentische KI-Anwendungsfälle, bei denen ein Modell mehrstufige Aufgaben autonom ausführt statt eine einzelne Anfrage zu beantworten, verursachen pro Sitzung einen weitaus höheren Rechenaufwand als Konversationsnutzung. Wie die Analyse von Lago zu KI-Preismodellen deutlich macht, ist die Überwachung der Nutzung und die Wahl des richtigen Preismodells für jedes KI-Unternehmen eine echte Hochrisikofrage: Eine falsche Annahme über die Nutzungstiefe kann die Einheitswirtschaft zum Einsturz bringen, von der die gesamte Produktmarge abhängt. Das Redaktionsteam von Aria Systems formulierte es noch direkter und argumentiert, dass pauschale Abonnements strukturell unvereinbar mit der Ökonomie von KI-Produkten sind.
Wie die Neugestaltung der Preisgestaltung konkret aussieht
Die Branche bleibt nicht untätig. Dholakias „Pricing Conundrum"-Beitrag, der im Mai 2026 veröffentlicht wurde, dokumentiert eine ganze Generation neuer Strukturen, die als Reaktion darauf entwickelt werden: engere kostenlose Einstiegstarife, Nutzungsobergrenzen, verbrauchsabhängige Abrechnung, ergebnisbasierte Gebühren, Benchmarks für den Ersatz menschlicher Arbeit und Rahmenwerke zur Bewertung der Arbeit von KI-Agenten. Bessemer Venture Partners hat ein detailliertes KI-Preisgestaltungs- und Monetarisierungs-Playbook veröffentlicht, das zeigt, wie Anbieter ihre Preisstrukturen an den tatsächlichen Kosten der Bereitstellung von KI-Mehrwert ausrichten können.
Der gemeinsame Nenner all dieser Ansätze ist die Abkehr von der Pauschalpreis-Annahme hin zu Strukturen, die es ermöglichen, dass die Einnahmen mit dem verbrauchten Rechenaufwand skalieren. Die TechCrunch-Berichterstattung vom Juni 2026 über Googles Schritte im KI-Abonnementmarkt signalisiert, dass selbst die größten Akteure aktiv neu bepreisen und neu positionieren – was bedeutet, dass die Wettbewerbslandschaft in echtem Wandel begriffen ist.
Für alle, die ein Produkt auf KI-Infrastruktur aufbauen, ist die Empfehlung von RevenueCat operativ konkret: Modelliere die KI-Nutzung anhand deiner ARPU- und Bindungsmetriken, leite Anfragen nach Möglichkeit an kosteneffiziente Modelle weiter, nutze generierte Ergebnisse wieder statt sie neu zu generieren, und beschränke den Zugang zu fortgeschrittenen KI-Funktionen auf kostenpflichtige Tarife, die die tatsächlichen Kosten für die Bedienung von Vielnutzern widerspiegeln. Das sind keine theoretischen Best Practices. Es sind die Mechanismen, um den Übergang von Pauschalpreis-Annahmen zu einer Welt zu überstehen, in der die tatsächliche Auslastung wirklich zählt.
Was zu beobachten ist und worauf hinzuarbeiten ist
Die von Dholakia beschriebene Neugestaltung der Preisgestaltung steckt noch in den Anfängen. Der größte Teil der Branchendiskussion hat sich, wie er anmerkt, auf die Perspektive des Verkäufers konzentriert – mit kaum ernsthafter Auseinandersetzung damit, wie Kunden die neuen Strukturen tatsächlich wahrnehmen und bewerten werden. Diese Lücke ist enorm wichtig für alle, die KI-gestützte Produkte entwickeln: Man kann ein verbrauchsbasiertes oder ergebnisbasiertes Preismodell entwerfen, das wirtschaftlich vernünftig ist, und trotzdem Kunden verlieren, die durch vierzig Jahre pauschaler SaaS-Preisgestaltung darauf trainiert wurden, vorhersehbare Monatsrechnungen zu erwarten. Die Hälfte dieses Problems, die mit der Kundenwahrnehmung zu tun hat, wird darüber entscheiden, welche neuen Preisstrukturen sich tatsächlich durchsetzen.
Die konstruktive Lesart ist, dass dieser Moment wirklich lehrreich ist. Jedes KI-Abonnement, das du bewertest – ob als Nutzer, Entwickler oder Investor – bringt nun eine versteckte Frage mit sich, die es wert ist, gestellt zu werden: Welche Auslastungsrate setzt dieser Preis voraus, und was passiert mit dem Unternehmen, wenn die tatsächliche Nutzung anders aussieht? Die Teams, die diese Frage früh verinnerlichen und Preisarchitekturen aufbauen, die sich an reale Nutzungsmuster anpassen können, werden am ehesten noch stehen, wenn die Ära des subventionierten Wachstums bei der KI-Preisgestaltung endet.
