
इस लेख में (4)
संभाव्य हार्डवेयर, बड़े एक्सेलेरेटर नहीं, एआई की दक्षता में अगली छलांग हो सकता है
मुख्य बातें
- AI दक्षता के दावों को केवल एक्सेलरेटर के आकार या प्रोसेस नोड से नहीं, बल्कि वर्कलोड के अनुकूलता के आधार पर परखें।
- प्रायिकतात्मक हार्डवेयर पर ध्यान दें क्योंकि डीनॉइज़िंग मॉडल विशेष ट्रांजिस्टर आर्किटेक्चर के साथ अच्छी तरह मेल खा सकते हैं।
- 10,000 गुना ऊर्जा परिणाम को एक सरल इमेज बेंचमार्क से जुड़े शोध संकेत के रूप में लें।
एक Nature पेपर तर्क देता है कि diffusion-जैसे मॉडल्स को शायद probability के लिए बने circuits चाहिए, न कि एक और बड़ा math furnace.
एक Nature पेपर का तर्क है कि diffusion-जैसे मॉडल शायद probability के लिए बनाए गए circuits चाहते हैं, न कि एक और बड़ा mathematical furnace.
कमरे में सबसे रोचक AI accelerator शायद सिलिकॉन की कोई और बड़ी पट्टी न हो, जो एक और power rail और commitment issues वाले cooling loop की माँग कर रही हो। वह शायद एक अजीब कदम हो: probabilistic models से यह दिखावा करवाना बंद करें कि वे साधारण deterministic math हैं, और फिर मशीन को probability के इर्द-गिर्द ही बनाएँ। यही छिपा हुआ रास्ता है An efficient probabilistic hardware architecture for diffusion-like models में, जो npj Unconventional Computing में प्रकाशित हुआ है। बड़े accelerators AI compute के bulldozers हैं; यह paper पूछता है कि क्या diffusion-like models को शायद एक lockpick ज्यादा पसंद आएगा।
Nature का चेसिस शॉट
Nature इस काम को npj Unconventional Computing, volume 3, Article number 30, 2026 में सूचीबद्ध करता है, और abstract समस्या को hardware mismatch के रूप में पेश करता है। Nature के अनुसार, पहले के specialized stochastic computers ने efficiency gains का वादा किया था, लेकिन वे आगे नहीं बढ़ पाए क्योंकि वे सीमित modeling techniques और exotic, unscalable hardware पर निर्भर थे। प्रस्तावित escape hatch एक all-transistor probabilistic computer है, जो शक्तिशाली denoising models को hardware level पर लागू करता है। यह phrase, all-transistor, teardown में छिपा हुआ fastener है: लेखक probability को किसी physics lab terrarium में रहने को नहीं कह रहे, वे इसे transistor country में व्यवहार करना सिखाने की कोशिश कर रहे हैं।
व्यावहारिक बात यह नहीं है कि conventional accelerators मूर्ख हैं। GPUs general-purpose math furnaces होने में बहुत अच्छे हैं, ऐसी मशीनें जो matrix work को सराहनीय अनुशासन के साथ heat में बदल देती हैं। लेकिन diffusion-like models probabilistic denoising के इर्द-गिर्द बने होते हैं, और Nature abstract कहता है कि यह प्रस्ताव उस denoising structure को hardware में ले जाता है। अगर workload नियमों वाला एक casino है, तो शायद chip को filing cabinet की तरह acting करना बंद कर देना चाहिए।
arXiv का पावर पाथ
arXiv version वह spec देता है जिसे देखकर कोई EE लाल pen उठाने लगे। arXiv के अनुसार, system-level analysis संकेत देता है कि प्रस्तावित architecture पर आधारित devices एक simple image benchmark पर GPUs के बराबर performance हासिल कर सकते हैं, जबकि लगभग 10,000 गुना कम energy इस्तेमाल करेंगे। यही वह वाक्य है जो heat spreader के नीचे छिपा है। यह सिर्फ यह नहीं कहता कि वही arithmetic ज्यादा efficiently करो; यह कहता है कि physical architecture को computation के probabilistic shape से match करो।
आपको इसकी परवाह क्यों करनी चाहिए? क्योंकि arXiv paper यह भी कहता है कि U.S. firms हर साल AI-focused data centers पर Apollo program की inflation-adjusted cost से अधिक खर्च करती हैं, और 2030 तक ये data centers U.S. में पैदा होने वाली कुल energy का 10% consume कर सकते हैं। ये infrastructure numbers हैं, nerd trivia नहीं। जब energy first-class design constraint बन जाती है, तो architecture academic parlor trick होना बंद कर देता है और power delivery heist scene जैसा दिखने लगता है, जहाँ हर बची हुई memory trip मेज पर सोए एक और guard जैसी है।
Springer का Workload Context
Springer Nature का large AI models पर overview यह समझने की पृष्ठभूमि देता है कि यह क्यों मायने रखता है: large-scale AI models एक focal point बन गए हैं, जिनमें Google का BERT और OpenAI का GPT जैसे examples शामिल हैं, और parameter sizes hundreds of billions या यहाँ तक कि tens of trillions तक पहुँच रहे हैं। वही overview इस rise का एक हिस्सा काफी बड़े training data को बताता है। दूसरे शब्दों में, mainstream story scale की रही है: अधिक parameters, अधिक data, अधिक compute, अधिक सब कुछ। यह story तब तक काम करती है जब तक wall outlet अपना गला साफ करना शुरू नहीं करता।
Diffusion-like models architectural question को और तेज बना देते हैं, क्योंकि वे tensor mill से गुजरने वाला बस एक और anonymous workload नहीं हैं। Nature paper का denoising models पर जोर algorithm और circuit के बीच अधिक intimate mapping का संकेत देता है, जैसे हर दरवाजे पर hydraulic ram लाने के बजाय एक lock के लिए खास key काटना। यहीं अच्छा hardware सम्मान कमाता है: बड़े numbers चिल्लाकर नहीं, बल्कि कम motion waste करके। एक transistor जो problem की structure में भाग लेता है, वह सिर्फ switching से ज्यादा कर रहा है; वह conspiracy में शामिल हो रहा है।
arXiv Metadata और क्या देखना है
arXiv record इस काम को Computer Science में arXiv:2510.23972 के रूप में पहचानता है, subjects Machine Learning और Artificial Intelligence के साथ, और 13 pages तथा 6 figures सूचीबद्ध करता है। यह मायने रखता है क्योंकि यह claim को product launch cycle के बजाय research artifact में anchor करता है। इसे पढ़ने का सही तरीका है: एक architectural argument, जिसके साथ बहुत बड़ा energy target जुड़ा है। गलत तरीका यह है कि 10,000 गुना figure को हर GPU workload के लिए universal replacement sticker मान लिया जाए।
अगली देखने वाली बात यह है कि probabilistic hardware public literature में system-level analysis से आगे बढ़कर अधिक concrete implementation evidence की ओर जाता है या नहीं। AI systems बनाने, खरीदने, या evaluate करने वाले readers के लिए lesson पहले से उपयोगी है: efficiency सिर्फ process node story, memory bandwidth story, या cooling story नहीं है। यह workload-shape story भी है। अगर generative AI probabilistic computation की ओर झुकता रहता है, तो सबसे महत्वपूर्ण accelerator question शायद यह कम हो जाए कि chip कितना बड़ा है, और यह ज्यादा हो जाए कि chip math से कितनी ईमानदारी से match करता है।