ब्रायन आर्मस्ट्रॉन्ग की 5 रणनीतियाँ: टोकन कैप्स से ज़्यादा AI लागत आर्किटेक्चर को प्राथमिकता
मुख्य बातें
- एआई लागत नियंत्रण को वास्तुकला से जुड़ा काम मानें, न कि पूरी कंपनी के लिए टोकन की कटौती।
- कठिन कार्यों के लिए प्रीमियम मॉडल उपलब्ध रखते हुए सस्ते और सक्षम मॉडलों को डिफ़ॉल्ट के रूप में सेट करें।
- एआई खर्च को वर्कफ़्लो के अनुसार ट्रैक करें ताकि उच्च उपयोग को मापनीय परिणामों से जोड़ा जा सके।
Coinbase के CEO सस्ते डिफ़ॉल्ट, बेहतर रूटिंग और सीमित प्रयोगों के बजाय जवाबदेही के व्यावहारिक पक्ष को सामने रख रहे हैं।
Coinbase के CEO सस्ते डिफ़ॉल्ट विकल्पों, बेहतर रूटिंग, और सीमित प्रयोगों के बजाय जवाबदेही के लिए व्यावहारिक तर्क दे रहे हैं।
AI बिल को छोटा दिखाने का सबसे तेज़ तरीका है सबको “submit” क्लिक करने से डराना। संयोग से, यही आपके चमकदार आंतरिक AI रोलआउट को एक महंगे सुझाव बॉक्स में बदलने का भी शानदार तरीका है। Business Insider ने रिपोर्ट किया कि Coinbase के CEO Brian Armstrong ने टोकन उपयोग को सीमित किए बिना AI खर्च कम रखने की 5 रणनीतियाँ बताईं। यह उस दुर्लभ एग्जीक्यूटिव AI लागत मेमो जैसा है जो कटौती से नहीं, अपनाने से शुरू होता है। असली सीख यह नहीं है कि Coinbase ने inference के लिए कोई कूपन दराज़ खोज ली। बल्कि यह है कि AI लागत नियंत्रण आर्किटेक्चर में होना चाहिए, ऐसी blanket restrictions में नहीं जो हर prompt को प्रतिबंधित सामान जैसा मानती हैं।
Business Insider: बिल को आर्किटेक्चर लेयर में जाना चाहिए
Business Insider की Aditi Bharade ने रिपोर्ट किया कि Armstrong Coinbase में टोकन उपयोग सीमित किए बिना AI खर्च कम रखने की योजना बना रहे हैं। यह फर्क सच में महत्वपूर्ण है। usage cap एक blunt instrument है—बेकाबू बिल रोकने के लिए ठीक, लेकिन किसी संगठन को यह सिखाने के लिए खराब कि AI वास्तव में कहाँ मदद करता है। यह इंजीनियरिंग में किराने का बजट घटाने के लिए फ्रिज पर ताला लगाने जैसा है: तकनीकी रूप से असरदार, लेकिन भावना के स्तर पर बेकार।
AOL के syndicated Business Insider coverage में operational context भी जोड़ा गया है: Armstrong ने कहा कि वे AI usage को दबाना नहीं चाहते, बल्कि scaling को अधिक sustainable बनाना चाहते हैं। यह engineering leaders के लिए उपयोगी mental model है, क्योंकि ज़्यादातर AI cost problems लोगों के tools बहुत ज़्यादा इस्तेमाल करने से नहीं होते। वे इसलिए होते हैं क्योंकि हर task उसी महंगे रास्ते से गुजरता है—जैसे postcard को private jet से भेजना, क्योंकि mailroom ने एक premium stamp खरीद लिया और उससे भावनात्मक लगाव हो गया।
AOL: defaults hoodie पहनी हुई policy हैं
AOL की syndicated Business Insider report के अनुसार, Armstrong की रणनीतियों में पहली थी बेहतर default LLMs चुनना, यानी वे models जिन्हें engineers prompts submit करते समय default रूप से इस्तेमाल करते हैं। रिपोर्ट कहती है कि Coinbase default के रूप में Chinese LLMs के साथ experiment कर रहा है, जिन्हें Anthropic और OpenAI जैसी frontier American AI labs के models की तुलना में काफी सस्ता बताया गया है। इसी संदर्भ में GLM 5.2 जैसे open weight models का भी ज़िक्र है।
इसका मतलब यह नहीं है कि हर company को menu पर सबसे सस्ते model के पीछे आँख बंद करके भागना चाहिए, क्योंकि ऐसा करने से compliance reviews का माहौल haunted printer जैसा हो सकता है। बात इससे ज़्यादा subtle और useful है: defaults चुपचाप behavior तय करते हैं। अगर ज़्यादातर internal prompts routine coding help, summaries, drafting, test generation, या workflow glue हैं, तो एक capable lower cost model काफी हो सकता है। Premium models उन tasks के लिए available रखें जिन्हें उनकी ज़रूरत है, लेकिन उन्हें हर employee के हर सवाल का automatic answer न बनाएँ। Default सिर्फ UI choice नहीं है। यह sneakers पहनी हुई budget policy है।
Business Insider: cost control को scold नहीं, router चाहिए
Business Insider के Henry Chandonnet ने रिपोर्ट किया कि Armstrong ने एक ऐसे measure का वर्णन किया जिसका लक्ष्य token usage बढ़ने पर भी costs को roughly flat रखना है। उसी Business Insider snippet में Armstrong को यह लिखते हुए quote किया गया है कि "the limiting factor will be energy and compute, not better models." यह line महत्वपूर्ण है क्योंकि यह बातचीत को model worship से systems design की ओर ले जाती है। अगर compute constraint है, तो routing, caching, और task matching अच्छे अतिरिक्त फीचर नहीं हैं। वे plumbing हैं।
बेहतर defaults, routing, और caching के बारे में Armstrong की public framing मूल रूप से model selection का grown up version है। जब planning को depth चाहिए, तब stronger model इस्तेमाल करें। जब execution repetitive हो, तब cheaper model इस्तेमाल करें। जो repeat होता है उसे cache करें, क्योंकि उसी context के लिए फिर से पूरी कीमत चुकाना हर बार toast बनाने के लिए नया toaster खरीदने जैसा है। Technical move यह है कि users और models के बीच एक LLM gateway या orchestration layer रखा जाए, ताकि system vibes के बजाय task, price, और reuse के आधार पर choose कर सके।
AOL: accountability panic buttons से बेहतर है
AOL की syndicated Business Insider coverage कहती है कि Armstrong की tips में high spending employees से tangible results की अपेक्षा करना भी शामिल है। यह वह हिस्सा है जिसकी हर AI budget conversation को अंततः ज़रूरत पड़ती है—बेहतर होगा finance के spreadsheets में बोलना शुरू करने और सबके समझ न आने का नाटक करने से पहले। अगर कोई team भारी खर्च कर रही है, तो उपयोगी सवाल यह नहीं है कि वे naughty token goblins हैं या नहीं। सवाल यह है कि क्या spend output, learning, automation, या faster delivery से जुड़ता है।
Builders के लिए takeaway practical है। AI usage को सिर्फ person के हिसाब से नहीं, workflow के हिसाब से instrument करें। Track करें कि कौन से models किन tasks के लिए इस्तेमाल हो रहे हैं, cache misses कहाँ हो रहे हैं, और expensive calls कहाँ measurable value पैदा करती हैं। फिर cheaper, safer path को default बनाएँ, जबकि higher capability models के लिए escape hatches बचाए रखें। सबसे सस्ता prompt वह नहीं है जिसे कोई भेजता ही नहीं। वह है जिसके लिए आपका architecture overpaying रोक देता है।
