In this article (4)
OpenAI Membangun Chip Sendiri. Inilah Mengapa Langkah Ini Lebih Besar dari yang Terlihat.
Key Takeaways
- Penghematan biaya ~50% Jalapeno dibandingkan GPU, yang dikutip oleh CEO Broadcom Hock Tan, adalah inti dari kasus bisnis bagi OpenAI untuk memiliki silikon inferensi sendiri daripada menyewa komputasi serbaguna.
- ASIC menukar fleksibilitas dengan efisiensi; Jalapeno dirancang secara khusus untuk inferensi LLM, yang berarti unggul dalam biaya pada skala besar tetapi tidak dapat dengan mudah beradaptasi jika pola inferensi berubah.
- Kemitraan OpenAI-Broadcom-Celestica membagi desain chip, implementasi silikon, dan sistem produksi ke tiga spesialis — sebuah model yang layak dipelajari oleh siapa pun yang membangun infrastruktur AI dalam skala besar.
Jalapeno, ASIC inferensi khusus pertama OpenAI yang dibangun bersama Broadcom, menukarkan fleksibilitas dengan biaya dan kendali pada skala LLM.
Jalapeno, ASIC inferensi khusus pertama OpenAI yang dibangun bersama Broadcom, menukar fleksibilitas dengan biaya dan kendali pada skala LLM.
H100 milik Nvidia dalam infrastruktur AI ibarat tema WordPress bawaan dalam desain web: fungsional sempurna, digunakan secara luas, dan merupakan tanda bahwa seseorang belum terlalu memikirkan keterbatasan spesifik mereka. OpenAI, yang telah sangat serius memikirkan keterbatasan spesifiknya sendiri, baru saja mengumumkan bahwa mereka punya rencana berbeda. Kenalkan Jalapeno, chip inferensi kustom pertama OpenAI, dibangun bersama Broadcom dan dioptimalkan dari nol untuk inferensi model bahasa besar dalam skala besar.
Apa Sebenarnya Jalapeno Itu
Jalapeno adalah sebuah ASIC, atau application-specific integrated circuit, yang artinya chip ini memang sengaja bukan akselerator serbaguna. Kalau GPU ibarat pisau lipat Swiss Army yang bisa menangani pelatihan, inferensi, grafis, dan apapun yang kamu lemparkan ke sana, maka ASIC adalah satu bilah yang sangat tajam untuk satu tujuan saja.
Menurut pengumuman resmi dari OpenAI, chip ini dirancang berdasarkan pemahaman mendalam OpenAI tentang dasar-dasar LLM, yang dibentuk oleh peta jalan model, kernel, sistem serving, dan kebutuhan produk mereka. Bagian terakhir itu perlu direnungkan: chip ini dibentuk oleh tim yang sama yang memutuskan model apa yang dibangun dan bagaimana cara melayaninya. Siklus umpan balik arsitekturnya sangat pendek.
Berdasarkan laporan dari DBTA, sampel rekayasa Jalapeno sudah menjalankan beban kerja ML di lab pada frekuensi dan daya target produksi, termasuk GPT-5.3-Codex-Spark—yang bisa jadi merupakan tanda kemajuan nyata yang menggembirakan, atau detail yang sengaja dipilih agar para investor merasa tenang. Kemungkinan besar keduanya.
Menurut Tom's Hardware, chip ini berhasil dari konsep hingga tape-out dalam sembilan bulan, sebuah kecepatan yang digambarkan laporan tersebut sebagai ultra-cepat untuk sebuah ASIC berukuran retikel. Model AI milik OpenAI sendiri dilaporkan mempercepat desain dan optimasi chip dalam kurun waktu itu, yang artinya Jalapeno adalah—dengan cara yang menyenangkan secara rekursif—sebuah produk AI yang sebagian dirancang oleh AI.
Argumen Biaya Adalah Segalanya
Kisah-kisah silicon kustom biasanya hadir dengan balutan tolok ukur performa dan diagram arsitektur, tetapi argumen sesungguhnya hampir selalu soal ekonomi. Menurut AI Weekly, CEO Broadcom Hock Tan secara terbuka menyebut penghematan biaya sekitar 50% dibandingkan GPU AI pada umumnya, menjadikannya angka biaya konkret pertama dari kedua perusahaan.
Bagi bisnis yang menjalankan inferensi pada skala yang dioperasikan OpenAI, pengurangan biaya komputasi sebesar 50% bukanlah catatan kaki; itu adalah seluruh alasan bisnis di balik sprint sembilan bulan, kemitraan multi-tahun, dan overhead organisasi untuk menjadi, pada dasarnya, sebuah perusahaan chip.
Kompromi ASIC itu nyata dan perlu disebutkan dengan jelas. GPU serbaguna mendapatkan premi mereka sebagian karena fleksibilitas: kamu bisa melatih ulang, menyempurnakan, bereksperimen, dan mengalihkan beban kerja tanpa mendesain ulang silikon. Sebuah ASIC bertaruh bahwa pola inferensimu cukup stabil sehingga spesialisasi terbayar. OpenAI membuat taruhan itu secara eksplisit, dan AI Weekly mencatat bahwa Jalapeno disetel secara sempit untuk inferensi LLM, menukar adaptabilitas dengan biaya dan efisiensi dalam skala besar. Jika pola serving LLM berubah secara dramatis, chip tersebut tidak ikut berubah. Itulah risiko yang tertanam dalam angka penghematan tersebut.
Struktur Kemitraan di Balik Chip
Jalapeno bukan proyek solo. Menurut DBTA, OpenAI merancang chip dari nol berdasarkan dasar-dasar LLM-nya, sementara Broadcom dan Celestica menangani implementasi chip, integrasi sistem board dan rack, jaringan berkinerja tinggi, dan sistem produksi yang dapat diskalakan.
Pembagian kerja itu penting: OpenAI membawa pengetahuan model dan persyaratan inferensi; Broadcom membawa pengalaman eksekusi silikon; Celestica mengindustrialisasi tumpukan fisik. Ini adalah pemisahan yang bersih tentang apa yang masing-masing pihak benar-benar lakukan dengan baik—sesuatu yang lebih jarang terjadi dalam kemitraan teknologi dibandingkan yang tersirat dalam siaran pers.
Kolaborasi strategis ini mendahului pengumuman chip ini beberapa bulan sebelumnya. Menurut pengumuman OpenAI sendiri dari Oktober 2025, kedua perusahaan sudah berkomitmen untuk menerapkan 10 gigawatt akselerator AI yang dirancang OpenAI sebagai bagian dari kemitraan multi-tahun yang mencakup sistem akselerator dan jaringan untuk klaster AI generasi berikutnya. Jalapeno adalah produk pertama yang mewujud dari komitmen tersebut, bukan pengumuman yang berdiri sendiri. Ini adalah generasi pertama dari platform komputasi multi-generasi yang telah dinyatakan, sesuai rilis investor Broadcom.
Hal yang Perlu Diperhatikan oleh Para Builder
Bagi siapa saja yang memikirkan infrastruktur AI melampaui proyek yang sedang dikerjakan saat ini, pengumuman Jalapeno membawa sinyal struktural yang layak untuk diperhatikan.
OpenAI secara eksplisit bertaruh bahwa memiliki lapisan inferensi—bukan sekadar menyewa waktu GPU—adalah cara untuk mengendalikan biaya dan latensi dalam skala besar. Logika itu tidak mengharuskanmu membangun chip sendiri; tetapi mengharuskanmu untuk memikirkan ke mana biaya inferensimu pergi seiring bertambahnya penggunaan, dan apakah premi fleksibilitas yang kamu bayarkan untuk perangkat keras serbaguna benar-benar memberikanmu sesuatu yang berguna.
Target penerapan 10 gigawatt dari pengumuman kolaborasi Oktober 2025 menunjukkan bahwa OpenAI tidak memperlakukan Jalapeno sebagai langkah lindung nilai. Ini adalah arah infrastruktur utama.
Bagi ekosistem builder AI lainnya, pertanyaan menarik ke depannya adalah apakah pengalaman Broadcom dalam merancang bersama platform ini pada akhirnya menghasilkan opsi silikon inferensi yang tidak eksklusif untuk OpenAI. Hal itu belum diumumkan. Namun pola desainnya, proses tape-out sembilan bulan yang dilaporkan dipercepat oleh model AI, dan model kemitraan berlapis antara pemilik model, perancang chip, dan integrator sistem—semuanya adalah hal-hal yang layak diperhatikan saat operator inferensi besar lainnya menghadapi perhitungan biaya yang sama.
