Wie viel günstiger ist Jalapeno im Vergleich zu Standard-KI-GPUs?

Broadcom-CEO Hock Tan nannte öffentlich rund 50% Kosteneinsparungen im Vergleich zu typischen KI-GPUs, laut AI Weekly. Dies ist die erste konkrete Kostenzahl, die eines der beiden Unternehmen veröffentlicht hat.

Wie lange hat es gedauert, den Jalapeno-Chip zu entwickeln?

Laut Tom's Hardware dauerte es neun Monate vom Konzept bis zum Tape-out – ein Tempo, das für einen retikelgroßen ASIC als extrem schnell beschrieben wird. OpenAIs eigene KI-Modelle halfen angeblich dabei, das Chipdesign und die Optimierung in diesem Zeitraum zu beschleunigen.

Wer sind die Partner, die an der Entwicklung von Jalapeno beteiligt sind?

OpenAI hat den Chip rund um seine LLM-Inferenzanforderungen entworfen. Broadcom übernahm die Chip-Implementierung und das Hochleistungsnetzwerk, während Celestica die Platinen-, Rack-Systemintegration und skalierbare Produktionssysteme verwaltete, laut DBTA.

Ist Jalapeno Teil eines größeren OpenAI-Infrastrukturplans?

Ja. OpenAI und Broadcom haben im Oktober 2025 eine strategische Zusammenarbeit angekündigt, die auf den Einsatz von 10 Gigawatt OpenAI-entwickelter KI-Beschleuniger abzielt. Jalapeno ist der erste Chip in dem, was beide Unternehmen als eine Multi-Generationen-Rechenplattform bezeichnen.

1 / 1

OpenAI Broadcom Jalapeno-Chip KI-Inferenz Maßgeschneidertes Silicon KI-Infrastruktur ASIC breaking-news

Hallucination Free Heute

In this article (4)

Anwendungsspezifischer integrierter Schaltkreis Ein **anwendungsspezifischer integrierter Schaltkreis** (englisch: *application-specific integrated circuit*, kurz **ASIC**) ist ein Mikrochip, der für einen ganz bestimmten Zweck oder eine bestimmte Aufgabe entworfen und hergestellt wird – im Gegensatz zu Allzweckchips wie Prozessoren, die viele verschiedene Aufgaben ausführen können. ## Was ist ein ASIC? Ein ASIC ist ein integrierter Schaltkreis, der für eine einzige, spezialisierte Funktion maßgeschneidert ist. Statt flexibel und vielseitig zu sein, ist er von Grund auf für maximale Effizienz bei einer bestimmten Aufgabe optimiert. - **Integrierter Schaltkreis**: viele elektronische Bauteile (Transistoren, Widerstände, Kondensatoren) auf einem winzigen Stück Halbleitermaterial - **Anwendungsspezifisch**: nur für einen bestimmten Verwendungszweck gebaut - **Maßgefertigt**: für jede neue Anwendung von Grund auf neu entworfen ## Wie unterscheiden sich ASICs von anderen Chips? Es ist hilfreich, ASICs mit anderen Arten von Chips zu vergleichen: - **Allzweckprozessoren (CPUs)**: können beliebige Software ausführen und viele verschiedene Aufgaben erledigen – flexibel, aber nicht für eine bestimmte Aufgabe optimiert - **Field Programmable Gate Arrays (FPGAs)**: können nach der Herstellung neu programmiert werden – flexibler als ASICs, aber langsamer und energiehungriger - **ASICs**: fest verdrahtet für eine einzige Funktion – am wenigsten flexibel, aber am schnellsten und energieeffizientesten für ihre jeweilige Aufgabe ## Wie werden ASICs hergestellt? Der Entwurf und die Herstellung eines ASICs ist ein komplexer, mehrstufiger Prozess: 1. **Spezifikation**: Festlegen, was der Chip tun soll 2. **Schaltungsentwurf**: Erstellen einer logischen Beschreibung der Schaltung, häufig mithilfe von Hardwarebeschreibungssprachen wie VHDL oder Verilog 3. **Synthese**: Umwandlung der logischen Beschreibung in ein Netzwerk physischer Gatter 4. **Physisches Layout**: Festlegen der genauen Position jedes Transistors und jeder Verbindung auf dem Chip 5. **Verifizierung**: Simulieren und Testen des Entwurfs, um Fehler zu finden 6. **Fertigung**: Herstellen des Chips in einer Halbleiterfabrik (sogenannte „Fab") 7. **Test**: Prüfen der fertigen Chips auf korrekte Funktion Die Herstellung eines ASICs erfordert erhebliche Vorabinvestitionen – die Entwicklung der Fertigungsmasken allein kann Millionen von Dollar kosten. Daher lohnen sich ASICs vor allem bei hohen Stückzahlen oder bei Anwendungen, bei denen Leistung und Effizienz entscheidend sind. ## Wofür werden ASICs verwendet? ASICs kommen in vielen Bereichen des modernen Lebens zum Einsatz: - **Mobiltelefone**: eigene Chips für Mobilfunk, WLAN, GPS und Bildverarbeitung - **Kryptowährungs-Mining**: speziell zum Lösen der kryptografischen Berechnungen optimierte Chips, die für die Erzeugung von Kryptowährungen wie Bitcoin erforderlich sind - **Automobile**: Chips zur Steuerung von Motormanagement, Airbags, Infotainmentsystemen und Fahrerassistenz - **Netzwerkhardware**: Router und Switches nutzen ASICs, um Datenpakete mit hoher Geschwindigkeit weiterzuleiten - **Unterhaltungselektronik**: Fernseher, Spielekonsolen und Digitalkameras verwenden ASICs für die Medienverarbeitung - **Rechenzentren**: individuelle Chips für maschinelles Lernen und künstliche Intelligenz – etwa Googles Tensor Processing Unit (TPU) ## Vorteile von ASICs - **Hohe Leistung**: Da sie für eine Aufgabe optimiert sind, erledigen ASICs diese Aufgabe schneller als Allzweckchips - **Energieeffizienz**: ASICs verbrauchen für ihre Aufgabe deutlich weniger Strom als programmierbare Alternativen - **Geringere Größe**: Maßgeschneiderte Schaltkreise lassen sich kompakter gestalten - **Niedrigere Stückkosten bei Massenfertigung**: Sind die Entwicklungskosten erst einmal gedeckt, kann die Herstellung sehr wirtschaftlich sein ## Nachteile von ASICs - **Hohe Vorabkosten**: Entwurf und Fertigung sind teuer, was ASICs für kleine Stückzahlen ungeeignet macht - **Keine Flexibilität**: Ist ein ASIC hergestellt, lässt sich seine Funktion nicht mehr ändern - **Langer Entwicklungszyklus**: Der Entwurf eines ASICs kann Monate bis Jahre dauern - **Veraltungsrisiko**: Ändert sich die Anwendungsanforderung, muss möglicherweise ein völlig neuer Chip entworfen werden ## ASICs und das Moore'sche Gesetz Die ASIC-Entwicklung ist eng mit dem **Moore'schen Gesetz** verknüpft – der Beobachtung von Gordon Moore aus dem Jahr 1965, dass sich die Anzahl der Transistoren auf einem Chip etwa alle zwei Jahre verdoppelt. Mehr Transistoren ermöglichen leistungsfähigere und komplexere ASICs. In den letzten Jahren hat sich dieses Wachstum verlangsamt, da die physikalischen Grenzen der Transistorverkleinerung erreicht werden. Dennoch treiben Fortschritte in der Fertigungstechnologie die ASIC-Entwicklung weiterhin voran. ## Zusammenfassung ASICs sind spezialisierte Chips, die für maximale Effizienz bei einer einzigen Aufgabe entwickelt werden. Obwohl ihre Entwicklung kostspielig und zeitaufwendig ist, bieten sie bei Massenanwendungen unübertroffene Leistung und Energieeffizienz. Sie bilden das unsichtbare Fundament vieler Technologien, die wir täglich nutzen – von Smartphones bis hin zu Rechenzentren.

OpenAI hat seinen eigenen Chip entwickelt. Hier erfährst du, warum dieser Schritt größer ist, als er aussieht.

Key Takeaways

Jalapenos ~50% Kosteneinsparungen gegenüber GPUs, die von Broadcom-CEO Hock Tan genannt wurden, sind das zentrale Geschäftsargument dafür, dass OpenAI eigene Inferenz-Chips besitzt, anstatt allgemeine Rechenkapazitäten zu mieten.
ASICs tauschen Flexibilität gegen Effizienz; Jalapeno ist speziell für LLM-Inferenz optimiert, was bedeutet, dass es bei großem Maßstab kostenmäßig überzeugt, sich aber nicht leicht anpassen lässt, wenn sich Inferenzmuster ändern.
Die Partnerschaft zwischen OpenAI, Broadcom und Celestica verteilt Chipdesign, Silicon-Implementierung und Produktionssysteme auf drei Spezialisten – ein Modell, das für jeden, der KI-Infrastruktur im großen Maßstab aufbaut, studierenswert ist.

Was Jalapeno eigen…Das Kostenargument…Die Partnerschafts…Worauf Entwickler …

Hallucination Free · Heute

Jalapeño, OpenAIs erster benutzerdefinierter Inferenz-ASIC, entwickelt mit Broadcom, tauscht Flexibilität gegen Kosteneffizienz und Kontrolle im LLM-Maßstab.

Jalapeno, OpenAIs erster benutzerdefinierter Inferenz-ASIC, entwickelt mit Broadcom, tauscht Flexibilität gegen Kosteneffizienz und Kontrolle im LLM-Maßstab ein.

Nvidias H100s sind für die KI-Infrastruktur das, was das Standard-WordPress-Theme für Webdesign ist: absolut funktional, weit verbreitet und ein Zeichen dafür, dass sich jemand noch nicht allzu intensiv mit seinen spezifischen Anforderungen auseinandergesetzt hat. OpenAI, das sich sehr intensiv mit seinen spezifischen Anforderungen beschäftigt hat, hat gerade bekanntgegeben, einen anderen Weg zu gehen. Willkommen bei Jalapeno, OpenAIs erstem eigenen Inferenzchip, der gemeinsam mit Broadcom entwickelt und von Grund auf für Large-Language-Model-Inferenz im großen Maßstab optimiert wurde.

Was Jalapeno eigentlich ist

Jalapeno ist ein ASIC – ein anwendungsspezifischer integrierter Schaltkreis –, was bedeutet, dass er bewusst kein Allzweck-Beschleuniger ist. Während eine GPU ein Schweizer Taschenmesser ist, das Training, Inferenz, Grafik und alles andere erledigt, das man ihr zuwirft, ist ein ASIC eine einzige, sehr scharfe Klinge. Laut der offiziellen Ankündigung von OpenAI wurde der Chip auf Basis von OpenAIs tiefem Verständnis der LLM-Grundlagen entwickelt, informiert durch seine Roadmap für Modelle, Kernels, Serving-Systeme und Produktanforderungen. Dieser letzte Punkt verdient einen Moment der Aufmerksamkeit: Dieser Chip wird von demselben Team geprägt, das entscheidet, welche Modelle gebaut und wie sie bereitgestellt werden. Die architektonische Rückkopplungsschleife ist extrem kurz.

Laut Berichten von DBTA laufen Engineering-Samples von Jalapeno bereits im Labor mit ML-Workloads bei der angestrebten Produktionsfrequenz und -leistung, einschließlich GPT-5.3-Codex-Spark – was entweder ein ermutigendes Zeichen echter Fortschritte ist oder ein sehr spezifisches Detail, das Investoren ein gutes Gefühl geben soll. Wahrscheinlich beides. Laut Tom's Hardware ging der Chip in neun Monaten vom Konzept bis zum Tape-out, ein Tempo, das der Bericht als ultra-schnell für einen ASIC in Retikelgröße bezeichnet. OpenAIs eigene KI-Modelle haben die Chip-Entwicklung und -Optimierung in diesem Zeitraum offenbar beschleunigt, was bedeutet, dass Jalapeno auf angenehm rekursive Weise ein KI-Produkt ist, das teilweise von KI entworfen wurde.

Das Kostenargument ist das eigentliche Argument

Geschichten über Custom-Silicon kommen gewöhnlich im Gewand von Performance-Benchmarks und Architekturdiagrammen daher, aber das eigentliche Argument ist fast immer wirtschaftlicher Natur. Laut AI Weekly nannte Broadcom-CEO Hock Tan öffentlich rund 50 % Kosteneinsparungen im Vergleich zu typischen KI-GPUs und lieferte damit die erste konkrete Kostenzahl von einem der beiden Unternehmen. Für ein Unternehmen, das Inferenz in dem Maßstab betreibt, in dem OpenAI arbeitet, ist eine Kostenreduzierung von 50 % beim Rechnen keine Fußnote; es ist das gesamte wirtschaftliche Argument für den Neun-Monats-Sprint, die mehrjährige Partnerschaft und den organisatorischen Aufwand, faktisch zu einem Chip-Unternehmen zu werden.

Der ASIC-Kompromiss ist real und es lohnt sich, ihn klar zu benennen. Allzweck-GPUs rechtfertigen ihren Aufpreis teilweise durch Flexibilität: Man kann neu trainieren, feinabstimmen, experimentieren und Workloads umstellen, ohne den Chip neu zu entwerfen. Ein ASIC wettet darauf, dass die eigenen Inferenzmuster stabil genug sind, damit sich Spezialisierung auszahlt. OpenAI geht diese Wette ausdrücklich ein, und AI Weekly stellt fest, dass Jalapeno eng auf LLM-Inferenz ausgerichtet ist und Anpassungsfähigkeit gegen Kosten und Effizienz im großen Maßstab eintauscht. Wenn sich die LLM-Serving-Muster grundlegend verschieben, passt sich der Chip nicht mit an. Das ist das Risiko, das in der Einsparungszahl steckt.

Die Partnerschaftsstruktur hinter dem Chip

Jalapeno ist kein Solo-Projekt. Laut DBTA hat OpenAI den Chip von Grund auf rund um seine LLM-Grundlagen entwickelt, während Broadcom und Celestica die Chip-Implementierung, Board- und Rack-Systemintegration, Hochleistungsnetzwerke und skalierbare Produktionssysteme übernommen haben. Diese Arbeitsteilung ist bedeutsam: OpenAI bringt das Modell-Wissen und die Inferenzanforderungen ein; Broadcom bringt die Erfahrung in der Silicon-Umsetzung mit; Celestica industrialisiert den physischen Stack. Es ist eine saubere Trennung dessen, was jede Partei tatsächlich gut kann – was in Tech-Partnerschaften seltener ist, als die Pressemitteilungen vermuten lassen.

Die strategische Zusammenarbeit geht der Ankündigung dieses Chips um mehrere Monate voraus. Laut OpenAIs eigener Ankündigung vom Oktober 2025 hatten sich die Unternehmen bereits verpflichtet, 10 Gigawatt von OpenAI-entwickelten KI-Beschleunigern als Teil einer mehrjährigen Partnerschaft bereitzustellen, die Beschleuniger- und Netzwerksysteme für KI-Cluster der nächsten Generation umfasst. Jalapeno ist das erste Produkt, das aus dieser Verpflichtung entsteht, und keine eigenständige Ankündigung. Es ist die erste Generation einer erklärten Multi-Generationen-Rechenplattform, so die Broadcom-Investoren-Pressemitteilung.

Worauf Entwickler wirklich achten sollten

Für alle, die über KI-Infrastruktur hinaus über das unmittelbare Projekt nachdenken, das vor ihnen liegt, enthält die Jalapeno-Ankündigung ein strukturelles Signal, das es zu verfolgen lohnt. OpenAI wettet ausdrücklich darauf, dass der Besitz der Inferenzebene – und nicht nur das Mieten von GPU-Zeit – der Weg ist, Kosten und Latenz im großen Maßstab zu kontrollieren. Diese Logik erfordert nicht, dass man seinen eigenen Chip baut; sie erfordert jedoch, darüber nachzudenken, wohin die Inferenzkosten gehen, wenn die Nutzung skaliert, und ob die Flexibilitätsprämie, die man für Allzweck-Hardware zahlt, tatsächlich irgendeinen konkreten Nutzen bringt.

Das Bereitstellungsziel von 10 Gigawatt aus der Kooperationsankündigung vom Oktober 2025 deutet darauf hin, dass OpenAI Jalapeno nicht als Absicherung betrachtet. Es ist eine primäre Infrastrukturrichtung. Für den Rest des KI-Entwickler-Ökosystems stellt sich die interessante nachgelagerte Frage, ob Broadcoms Erfahrung bei der Co-Entwicklung dieser Plattform letztendlich Inferenz-Silicon-Optionen hervorbringt, die nicht exklusiv für OpenAI sind. Das wurde noch nicht angekündigt. Aber die Entwurfsmuster, der Neun-Monats-Tape-out-Prozess, der Berichten zufolge durch KI-Modelle beschleunigt wurde, und das mehrschichtige Partnerschaftsmodell zwischen Modellinhaber, Chip-Designer und Systemintegrator sind allesamt Dinge, die es zu beobachten gilt, da andere große Inferenz-Betreiber mit derselben Kostenrechnung konfrontiert sind.

Quellen

Questions & answers

Jalapeno ist OpenAIs erster maßgeschneiderter KI-Inferenzchip, ein ASIC, der in Zusammenarbeit mit Broadcom entwickelt und speziell für Large-Language-Model-Inferenz-Workloads konzipiert wurde. Ingenieurmuster laufen bereits im Labor mit ML-Workloads, darunter GPT-5.3-Codex-Spark.