In this article (4)
OpenAI hat seinen eigenen Chip entwickelt. Hier erfährst du, warum dieser Schritt größer ist, als er aussieht.
Key Takeaways
- Jalapenos ~50% Kosteneinsparungen gegenüber GPUs, die von Broadcom-CEO Hock Tan genannt wurden, sind das zentrale Geschäftsargument dafür, dass OpenAI eigene Inferenz-Chips besitzt, anstatt allgemeine Rechenkapazitäten zu mieten.
- ASICs tauschen Flexibilität gegen Effizienz; Jalapeno ist speziell für LLM-Inferenz optimiert, was bedeutet, dass es bei großem Maßstab kostenmäßig überzeugt, sich aber nicht leicht anpassen lässt, wenn sich Inferenzmuster ändern.
- Die Partnerschaft zwischen OpenAI, Broadcom und Celestica verteilt Chipdesign, Silicon-Implementierung und Produktionssysteme auf drei Spezialisten – ein Modell, das für jeden, der KI-Infrastruktur im großen Maßstab aufbaut, studierenswert ist.
Jalapeño, OpenAIs erster benutzerdefinierter Inferenz-ASIC, entwickelt mit Broadcom, tauscht Flexibilität gegen Kosteneffizienz und Kontrolle im LLM-Maßstab.
Jalapeno, OpenAIs erster benutzerdefinierter Inferenz-ASIC, entwickelt mit Broadcom, tauscht Flexibilität gegen Kosteneffizienz und Kontrolle im LLM-Maßstab ein.
Nvidias H100s sind für die KI-Infrastruktur das, was das Standard-WordPress-Theme für Webdesign ist: absolut funktional, weit verbreitet und ein Zeichen dafür, dass sich jemand noch nicht allzu intensiv mit seinen spezifischen Anforderungen auseinandergesetzt hat. OpenAI, das sich sehr intensiv mit seinen spezifischen Anforderungen beschäftigt hat, hat gerade bekanntgegeben, einen anderen Weg zu gehen. Willkommen bei Jalapeno, OpenAIs erstem eigenen Inferenzchip, der gemeinsam mit Broadcom entwickelt und von Grund auf für Large-Language-Model-Inferenz im großen Maßstab optimiert wurde.
Was Jalapeno eigentlich ist
Jalapeno ist ein ASIC – ein anwendungsspezifischer integrierter Schaltkreis –, was bedeutet, dass er bewusst kein Allzweck-Beschleuniger ist. Während eine GPU ein Schweizer Taschenmesser ist, das Training, Inferenz, Grafik und alles andere erledigt, das man ihr zuwirft, ist ein ASIC eine einzige, sehr scharfe Klinge. Laut der offiziellen Ankündigung von OpenAI wurde der Chip auf Basis von OpenAIs tiefem Verständnis der LLM-Grundlagen entwickelt, informiert durch seine Roadmap für Modelle, Kernels, Serving-Systeme und Produktanforderungen. Dieser letzte Punkt verdient einen Moment der Aufmerksamkeit: Dieser Chip wird von demselben Team geprägt, das entscheidet, welche Modelle gebaut und wie sie bereitgestellt werden. Die architektonische Rückkopplungsschleife ist extrem kurz.
Laut Berichten von DBTA laufen Engineering-Samples von Jalapeno bereits im Labor mit ML-Workloads bei der angestrebten Produktionsfrequenz und -leistung, einschließlich GPT-5.3-Codex-Spark – was entweder ein ermutigendes Zeichen echter Fortschritte ist oder ein sehr spezifisches Detail, das Investoren ein gutes Gefühl geben soll. Wahrscheinlich beides. Laut Tom's Hardware ging der Chip in neun Monaten vom Konzept bis zum Tape-out, ein Tempo, das der Bericht als ultra-schnell für einen ASIC in Retikelgröße bezeichnet. OpenAIs eigene KI-Modelle haben die Chip-Entwicklung und -Optimierung in diesem Zeitraum offenbar beschleunigt, was bedeutet, dass Jalapeno auf angenehm rekursive Weise ein KI-Produkt ist, das teilweise von KI entworfen wurde.
Das Kostenargument ist das eigentliche Argument
Geschichten über Custom-Silicon kommen gewöhnlich im Gewand von Performance-Benchmarks und Architekturdiagrammen daher, aber das eigentliche Argument ist fast immer wirtschaftlicher Natur. Laut AI Weekly nannte Broadcom-CEO Hock Tan öffentlich rund 50 % Kosteneinsparungen im Vergleich zu typischen KI-GPUs und lieferte damit die erste konkrete Kostenzahl von einem der beiden Unternehmen. Für ein Unternehmen, das Inferenz in dem Maßstab betreibt, in dem OpenAI arbeitet, ist eine Kostenreduzierung von 50 % beim Rechnen keine Fußnote; es ist das gesamte wirtschaftliche Argument für den Neun-Monats-Sprint, die mehrjährige Partnerschaft und den organisatorischen Aufwand, faktisch zu einem Chip-Unternehmen zu werden.
Der ASIC-Kompromiss ist real und es lohnt sich, ihn klar zu benennen. Allzweck-GPUs rechtfertigen ihren Aufpreis teilweise durch Flexibilität: Man kann neu trainieren, feinabstimmen, experimentieren und Workloads umstellen, ohne den Chip neu zu entwerfen. Ein ASIC wettet darauf, dass die eigenen Inferenzmuster stabil genug sind, damit sich Spezialisierung auszahlt. OpenAI geht diese Wette ausdrücklich ein, und AI Weekly stellt fest, dass Jalapeno eng auf LLM-Inferenz ausgerichtet ist und Anpassungsfähigkeit gegen Kosten und Effizienz im großen Maßstab eintauscht. Wenn sich die LLM-Serving-Muster grundlegend verschieben, passt sich der Chip nicht mit an. Das ist das Risiko, das in der Einsparungszahl steckt.
Die Partnerschaftsstruktur hinter dem Chip
Jalapeno ist kein Solo-Projekt. Laut DBTA hat OpenAI den Chip von Grund auf rund um seine LLM-Grundlagen entwickelt, während Broadcom und Celestica die Chip-Implementierung, Board- und Rack-Systemintegration, Hochleistungsnetzwerke und skalierbare Produktionssysteme übernommen haben. Diese Arbeitsteilung ist bedeutsam: OpenAI bringt das Modell-Wissen und die Inferenzanforderungen ein; Broadcom bringt die Erfahrung in der Silicon-Umsetzung mit; Celestica industrialisiert den physischen Stack. Es ist eine saubere Trennung dessen, was jede Partei tatsächlich gut kann – was in Tech-Partnerschaften seltener ist, als die Pressemitteilungen vermuten lassen.
Die strategische Zusammenarbeit geht der Ankündigung dieses Chips um mehrere Monate voraus. Laut OpenAIs eigener Ankündigung vom Oktober 2025 hatten sich die Unternehmen bereits verpflichtet, 10 Gigawatt von OpenAI-entwickelten KI-Beschleunigern als Teil einer mehrjährigen Partnerschaft bereitzustellen, die Beschleuniger- und Netzwerksysteme für KI-Cluster der nächsten Generation umfasst. Jalapeno ist das erste Produkt, das aus dieser Verpflichtung entsteht, und keine eigenständige Ankündigung. Es ist die erste Generation einer erklärten Multi-Generationen-Rechenplattform, so die Broadcom-Investoren-Pressemitteilung.
Worauf Entwickler wirklich achten sollten
Für alle, die über KI-Infrastruktur hinaus über das unmittelbare Projekt nachdenken, das vor ihnen liegt, enthält die Jalapeno-Ankündigung ein strukturelles Signal, das es zu verfolgen lohnt. OpenAI wettet ausdrücklich darauf, dass der Besitz der Inferenzebene – und nicht nur das Mieten von GPU-Zeit – der Weg ist, Kosten und Latenz im großen Maßstab zu kontrollieren. Diese Logik erfordert nicht, dass man seinen eigenen Chip baut; sie erfordert jedoch, darüber nachzudenken, wohin die Inferenzkosten gehen, wenn die Nutzung skaliert, und ob die Flexibilitätsprämie, die man für Allzweck-Hardware zahlt, tatsächlich irgendeinen konkreten Nutzen bringt.
Das Bereitstellungsziel von 10 Gigawatt aus der Kooperationsankündigung vom Oktober 2025 deutet darauf hin, dass OpenAI Jalapeno nicht als Absicherung betrachtet. Es ist eine primäre Infrastrukturrichtung. Für den Rest des KI-Entwickler-Ökosystems stellt sich die interessante nachgelagerte Frage, ob Broadcoms Erfahrung bei der Co-Entwicklung dieser Plattform letztendlich Inferenz-Silicon-Optionen hervorbringt, die nicht exklusiv für OpenAI sind. Das wurde noch nicht angekündigt. Aber die Entwurfsmuster, der Neun-Monats-Tape-out-Prozess, der Berichten zufolge durch KI-Modelle beschleunigt wurde, und das mehrschichtige Partnerschaftsmodell zwischen Modellinhaber, Chip-Designer und Systemintegrator sind allesamt Dinge, die es zu beobachten gilt, da andere große Inferenz-Betreiber mit derselben Kostenrechnung konfrontiert sind.
