Jalapeno सामान्य AI GPU की तुलना में कितना सस्ता है?

Broadcom के CEO Hock Tan ने AI Weekly के अनुसार सार्वजनिक रूप से सामान्य AI GPU की तुलना में लगभग 50% लागत बचत का उल्लेख किया। यह पहला ठोस लागत आंकड़ा है जो किसी भी कंपनी ने जारी किया है।

Jalapeno चिप बनाने में कितना समय लगा?

Tom's Hardware के अनुसार, चिप को अवधारणा से टेप-आउट तक नौ महीने लगे, जिसे रेटिकल-आकार के ASIC के लिए अत्यंत तेज़ गति बताया गया है। बताया जाता है कि OpenAI के अपने AI मॉडलों ने उस अवधि के दौरान चिप डिज़ाइन और अनुकूलन को गति देने में मदद की।

Jalapeno बनाने में कौन से साझेदार शामिल हैं?

OpenAI ने चिप को अपनी LLM अनुमान आवश्यकताओं के अनुसार डिज़ाइन किया। Broadcom ने चिप कार्यान्वयन और उच्च-प्रदर्शन नेटवर्किंग संभाली, जबकि Celestica ने DBTA के अनुसार बोर्ड, रैक सिस्टम एकीकरण और स्केलेबल उत्पादन प्रणालियों का प्रबंधन किया।

क्या Jalapeno OpenAI की बड़ी बुनियादी ढाँचा योजना का हिस्सा है?

हाँ। OpenAI और Broadcom ने अक्टूबर 2025 में एक रणनीतिक सहयोग की घोषणा की जिसका लक्ष्य OpenAI-डिज़ाइन किए गए AI त्वरकों के 10 गीगावाट की तैनाती है। Jalapeno पहली चिप है जिसे दोनों कंपनियाँ बहु-पीढ़ी कंप्यूट प्लेटफ़ॉर्म के रूप में वर्णित करती हैं।

1 / 1

OpenAI Broadcom Jalapeno चिप AI अनुमान कस्टम सिलिकॉन AI बुनियादी ढाँचा ASIC breaking-news

Hallucination Free आज

इस लेख में (4)

OpenAI ने अपनी खुद की चिप बनाई। यहाँ जानिए क्यों यह दाँव उतना बड़ा है जितना दिखता नहीं।

मुख्य बातें

Jalapeno की ~50% लागत बचत GPU की तुलना में, जिसका उल्लेख Broadcom के CEO Hock Tan ने किया, OpenAI के लिए सामान्य-उद्देश्य कंप्यूट किराए पर लेने के बजाय अपना खुद का अनुमान सिलिकॉन रखने के व्यावसायिक मामले का मूल आधार है।
ASIC लचीलेपन की जगह दक्षता को चुनते हैं; Jalapeno विशेष रूप से LLM अनुमान के लिए तैयार किया गया है, जिसका अर्थ है कि यह बड़े पैमाने पर लागत में जीतता है, लेकिन यदि अनुमान पैटर्न बदलता है तो आसानी से अनुकूलित नहीं हो सकता।
OpenAI-Broadcom-Celestica साझेदारी चिप डिज़ाइन, सिलिकॉन कार्यान्वयन और उत्पादन प्रणालियों को तीन विशेषज्ञों में विभाजित करती है, जो बड़े पैमाने पर AI बुनियादी ढाँचा बनाने वाले किसी भी व्यक्ति के लिए अध्ययन योग्य मॉडल है।

Jalapeno असल में ह…Cost वाला तर्क ही …Chip के पीछे की Pa…Builders को असल मे…

Hallucination Free · आज

जलापेनो, ओपनएआई का पहला कस्टम इन्फेरेंस ASIC जो ब्रॉडकॉम के साथ मिलकर बनाया गया है, LLM स्तर पर लागत और नियंत्रण के लिए लचीलेपन का समझौता करता है।

जैलापेनो, ब्रॉडकॉम के साथ मिलकर बनाया गया OpenAI का पहला कस्टम इन्फेरेंस ASIC है, जो LLM स्केल पर लागत और नियंत्रण के लिए लचीलेपन का समझौता करता है।

Nvidia के H100 AI इन्फ्रास्ट्रक्चर के लिए वही हैं जो web design के लिए default WordPress थीम है: पूरी तरह काम करने वाला, हर जगह इस्तेमाल होने वाला, और यह संकेत देने वाला कि किसी ने अभी तक अपनी खास ज़रूरतों के बारे में ज़्यादा नहीं सोचा। OpenAI ने अपनी खास ज़रूरतों के बारे में बहुत गहराई से सोचा है, और उसने अभी-अभी एक अलग योजना का ऐलान किया है। मिलिए Jalapeno से — OpenAI का पहला custom inference chip, जो Broadcom के साथ मिलकर बनाया गया है और शुरू से ही बड़े पैमाने पर large-language-model inference के लिए optimize किया गया है।

Jalapeno असल में है क्या

Jalapeno एक ASIC है — यानी application-specific integrated circuit — जिसका मतलब है कि यह जानबूझकर एक general-purpose accelerator नहीं है। जहाँ एक GPU एक Swiss Army knife की तरह है जो training, inference, graphics और जो भी काम आप उस पर डालें वो सब handle करता है, वहीं एक ASIC एक अकेला बहुत तेज़ धार वाला ब्लेड है।

OpenAI की आधिकारिक घोषणा के अनुसार, इस chip को LLM की बुनियादी समझ के आधार पर design किया गया है, जो OpenAI के models, kernels, serving systems और product ज़रूरतों के roadmap से प्रेरित है। यह आखिरी बात ध्यान देने वाली है: इस chip को उसी टीम ने आकार दिया है जो यह तय करती है कि कौन से models बनाए जाएँ और कैसे serve किए जाएँ। Architectural feedback loop बेहद छोटा है।

DBTA की रिपोर्टिंग के अनुसार, Jalapeno के engineering samples पहले से ही lab में production target frequency और power पर ML workloads चला रहे हैं, जिनमें GPT-5.3-Codex-Spark भी शामिल है — यह या तो असली प्रगति का उत्साहजनक संकेत है या investors को खुश करने के लिए चुना गया एक बहुत specific detail। शायद दोनों।

Tom's Hardware के अनुसार, chip concept से tape-out तक सिर्फ नौ महीनों में पहुँची — एक reticle-sized ASIC के लिए रिपोर्ट इसे ultra-fast गति बताती है। उस दौरान OpenAI के खुद के AI models ने chip design और optimization को तेज़ करने में मदद की, जिसका मतलब है कि Jalapeno एक सुखद recursive तरीके से एक AI product है जिसे आंशिक रूप से AI ने ही design किया।

Cost वाला तर्क ही असली तर्क है

Custom silicon की कहानियाँ आमतौर पर performance benchmarks और architectural diagrams के साथ आती हैं, लेकिन असली बात लगभग हमेशा आर्थिक होती है। AI Weekly के अनुसार, Broadcom के CEO Hock Tan ने सार्वजनिक रूप से typical AI GPUs की तुलना में लगभग 50% cost savings का ज़िक्र किया — यह किसी भी कंपनी की तरफ से पहला ठोस cost figure है।

जिस पैमाने पर OpenAI inference चलाता है, उसके लिए compute cost में 50% की कमी कोई छोटी बात नहीं है; यही नौ महीने की sprint, बहु-वर्षीय partnership, और एक chip company बनने के organizational overhead का पूरा business case है।

ASIC का tradeoff वास्तविक है और इसे स्पष्ट रूप से कहना ज़रूरी है। General-purpose GPUs अपनी premium कीमत कुछ हद तक flexibility की वजह से वसूलते हैं: आप silicon को redesign किए बिना retrain, fine-tune, experiment और workloads बदल सकते हैं। एक ASIC यह दाँव लगाता है कि आपके inference patterns इतने stable हैं कि specialization फायदेमंद हो। OpenAI यह दाँव खुलकर लगा रहा है, और AI Weekly नोट करती है कि Jalapeno को LLM inference के लिए बारीकी से tune किया गया है — adaptability की कीमत पर scale पर cost और efficiency मिलती है। अगर LLM serving patterns में बड़ा बदलाव आया, तो chip उनके साथ नहीं बदलेगी। यही savings के आँकड़े में छुपा हुआ जोखिम है।

Chip के पीछे की Partnership Structure

Jalapeno कोई अकेला project नहीं है। DBTA के अनुसार, OpenAI ने अपनी LLM fundamentals के आधार पर chip को scratch से design किया, जबकि Broadcom और Celestica ने chip implementation, board और rack system integration, high-performance networking, और scalable production systems संभाले।

यह श्रम-विभाजन महत्वपूर्ण है: OpenAI model knowledge और inference requirements लाता है; Broadcom silicon execution का अनुभव लाता है; Celestica physical stack को industrial रूप देती है। यह इस बात का एक साफ-सुथरा बँटवारा है कि हर पक्ष असल में क्या अच्छा करता है — जो tech partnerships में press releases से ज़्यादा दुर्लभ है।

यह strategic collaboration इस chip announcement से कई महीने पहले शुरू हो चुकी थी। OpenAI की अक्टूबर 2025 की अपनी घोषणा के अनुसार, कंपनियों ने next-generation AI clusters के लिए accelerator और network systems को cover करने वाली एक बहु-वर्षीय partnership के तहत 10 gigawatts के OpenAI-designed AI accelerators deploy करने की प्रतिबद्धता पहले ही जता दी थी। Jalapeno उस प्रतिबद्धता से निकलने वाला पहला product है — कोई standalone announcement नहीं। Broadcom investor release के अनुसार, यह एक stated multi-generation compute platform की पहली generation है।

Builders को असल में किस पर नज़र रखनी चाहिए

जो कोई भी अपने सामने मौजूद immediate project से आगे AI infrastructure के बारे में सोच रहा है, Jalapeno announcement एक structural signal लेकर आती है जो ध्यान देने लायक है।

OpenAI स्पष्ट रूप से यह दाँव लगा रहा है कि inference layer का मालिक होना — सिर्फ GPU time किराए पर लेने के बजाय — scale पर cost और latency control करने का तरीका है। इस logic के लिए ज़रूरी नहीं कि आप खुद chip बनाएँ; लेकिन ज़रूरी है कि आप यह सोचें कि जैसे-जैसे usage बढ़ता है आपकी inference costs कहाँ जाती हैं, और क्या आप general-purpose hardware के लिए जो flexibility premium दे रहे हैं वो आपको कुछ काम का दे भी रहा है।

अक्टूबर 2025 के collaboration announcement का 10-gigawatt deployment target बताता है कि OpenAI Jalapeno को एक hedge नहीं मान रहा। यह एक primary infrastructure direction है।

बाकी AI builder ecosystem के लिए, दिलचस्प downstream सवाल यह है कि क्या इस platform को co-design करने का Broadcom का अनुभव अंततः ऐसे inference silicon options पैदा करता है जो सिर्फ OpenAI तक सीमित न हों। इसकी घोषणा नहीं हुई है। लेकिन design patterns, AI models द्वारा कथित रूप से accelerated नौ महीने का tape-out process, और model owner, chip designer, और systems integrator के बीच की layered partnership model — ये सब देखने वाली चीज़ें हैं, क्योंकि दूसरे बड़े inference operators भी उसी cost math का सामना कर रहे हैं।

स्रोत

प्रश्न और उत्तर

Jalapeno, OpenAI की पहली कस्टम AI अनुमान चिप है, जो एक ASIC है और इसे Broadcom के सहयोग से बड़े-भाषा-मॉडल अनुमान कार्यभार के लिए विशेष रूप से डिज़ाइन किया गया है। इंजीनियरिंग नमूने पहले से ही प्रयोगशाला में ML कार्यभार चला रहे हैं, जिसमें GPT-5.3-Codex-Spark भी शामिल है।