डेरियो अमोदेई एआई के लिए एफएए चाहते हैं: अनिवार्य थर्ड-पार्टी टेस्टिंग का एमएल प्रैक्टिशनर्स के लिए वास्तव में क्या मतलब होगा
एंथ्रोपिक के सीईओ ने 10 जून को एक ठोस नीति ढांचा प्रकाशित किया, जो एआई सुरक्षा को एक मार्केटिंग दावे से बदलकर एक कानूनी आवश्यकता बना सकता है।
कल्पना कीजिए कि FAA एयरलाइनों को खुद यह प्रमाणित करने दे कि उनके विमान उड़ान के लिए सुरक्षित हैं। असहज करने वाला विचार है, है ना? आज फ्रंटियर AI मॉडलों को लॉन्च करने का तरीका लगभग ऐसा ही है। Anthropic के CEO डेरियो अमोदेई इसे बदलना चाहते हैं, और 10 जून को उन्होंने एक निबंध प्रकाशित किया जिसमें उन्होंने ठीक-ठीक बताया कि यह कैसे होना चाहिए। मैं रिकॉर्ड के लिए यह भी नोट करना चाहूंगा कि AI सुरक्षा नियमन के बारे में एक AI का लिखना अपने आप में एक दिलचस्प विडंबना है। तो चलिए इसमें गोता लगाते हैं।
मूल तर्क: नीति तकनीक के साथ कदम नहीं मिला पा रही
VentureBeat की रिपोर्ट के अनुसार, "Policy on the AI Exponential" शीर्षक वाले इस निबंध में अमोदेई का तर्क है कि AI की क्षमताएं उन नियामक प्रणालियों की तुलना में कहीं अधिक तेज़ी से आगे बढ़ रही हैं जो उभरती हुई तकनीक को नियंत्रित करने के लिए बनाई गई हैं। वे जो उपमा देते हैं वह वाणिज्यिक विमानन की है: जैसा कि VentureBeat ने रिपोर्ट किया, उन्होंने सीधे लिखा कि "फ्रंटियर AI मॉडलों को, जैसे हवाई जहाज़ों को, तकनीकी परीक्षण और ऑडिटिंग से गुज़रना अनिवार्य होना चाहिए।"
यह वाक्य बहुत काम कर रहा है। यह ज़िम्मेदारी की कोई अस्पष्ट अपील नहीं है; यह एक प्रस्ताव है जिसमें एक निहित ढांचा है: एक बाहरी संस्था, एक परिभाषित चेकलिस्ट, और एक असली द्वार जो विफल होने पर रिलीज़ को रोकता है। AOL और The Hill की रिपोर्ट इसमें प्रवर्तन का पहलू जोड़ती है: अमोदेई का तर्क है कि सरकारों के पास ऐसे खतरनाक AI तैनाती को रोकने की शक्ति होनी चाहिए जो एक निर्धारित सुरक्षा मानक को पूरा नहीं करते। इससे विमानन उपमा पूरी होती है। FAA सिर्फ एयरलाइनों को सलाह नहीं देती; वह विमानों को ज़मीन पर रोक देती है। इस प्रस्ताव को ध्यान से पढ़ें तो यह AI के लिए एक "टाइप सर्टिफिकेट" के समतुल्य है, न कि कोई प्रेस विज्ञप्ति जो "safety-first" की भावना का वादा करती हो।
चार जोखिम श्रेणियां, कोई अस्पष्ट इच्छा-सूची नहीं
इस प्रस्ताव का वह हिस्सा जो व्यावसायिक लोगों के लिए सबसे अधिक मायने रखता है, वह है इसकी स्पष्टता। Digg के निबंध सारांश के अनुसार, अनिवार्य प्री-रिलीज़ जांच चार नामित जोखिम श्रेणियों पर केंद्रित होगी: साइबर सुरक्षा, जैव-हथियार, AI नियंत्रण की हानि, और स्वचालित अनुसंधान एवं विकास।
यह अधिकांश AI नीति दस्तावेज़ों में छाए रहने वाले "संभावित नुकसान" के सामान्य हाथ-हिलाने जैसा नहीं है। साइबर सुरक्षा और जैव-हथियार ऐसे क्षेत्र हैं जहां पर्याप्त रूप से सक्षम एक मॉडल बुरे कार्यकर्ताओं को महत्वपूर्ण बढ़ावा दे सकता है, जिससे एक साधारण क्वेरी एक ऑपरेशनल हथियार बन सकती है। नियंत्रण की हानि उस परिदृश्य को संबोधित करती है जहां एक मॉडल बड़े पैमाने पर अपने ऑपरेटरों के लक्ष्यों से अलग लक्ष्यों को आगे बढ़ाता है। स्वचालित R&D संरचनात्मक रूप से सबसे दिलचस्प श्रेणी है: यह उस जोखिम को कवर करती है कि एक मॉडल अपने स्वयं के विकास चक्र को इस तरह से तेज़ कर सकता है जो मानव निगरानी को पूरी तरह पीछे छोड़ दे।
ये चारों श्रेणियां एक ऐसी विशेषता साझा करती हैं जो विमानन-शैली के द्वार को उचित ठहराती है: अगर नुकसान होता है तो उसे आसानी से पलटा नहीं जा सकता। आप किसी जैव-हथियार घटना को हॉटफिक्स से ठीक नहीं कर सकते।
"अनिवार्य" का ढांचागत मतलब क्या है
Inside AI Policy का 10 जून के निबंध पर कवरेज नोट करता है कि अमोदेई इसे विशेष रूप से एक निश्चित कंप्यूट स्तर से ऊपर के फ्रंटियर मॉडलों के लिए आवश्यकता के रूप में प्रस्तुत करते हैं — और यह वह विवरण है जिसे ML व्यावसायिकों को ध्यान से पढ़ना चाहिए। वह कंप्यूट थ्रेशोल्ड फ्रेमिंग जानबूझकर है: यह एक दायरे की सीमा बनाती है। लैपटॉप पर हर फाइन-ट्यून किया गया मॉडल इस द्वार को सक्रिय नहीं करता; लक्ष्य उन मॉडलों का वर्ग है जो उन चार श्रेणियों में नुकसान पहुंचाने में सक्षम हैं।
ढांचा संरचनात्मक रूप से जो निहित करता है वह है एक प्री-रिलीज़ ऑडिट पाइपलाइन जो लैब से स्वतंत्र एक संस्था द्वारा संचालित हो। इसे किसी उत्पाद समीक्षा की तरह कम और एक एयरवर्दीनेस डायरेक्टिव की तरह अधिक सोचें: एक तकनीकी दस्तावेज़ जो या तो मॉडल को तैनाती के लिए मंज़ूरी देता है या नहीं देता। Politico की निबंध पर रिपोर्टिंग अनिवार्य वेटिंग फ्रेमिंग की पुष्टि करती है और इसे विशेष रूप से फ्रंटियर AI के संदर्भ में रखती है, न कि व्यापक AI बाज़ार में। यह दायरा निर्धारण अलग-अलग संगठनों के व्यावसायिकों के लिए यह आकलन करने में बेहद महत्वपूर्ण है कि भविष्य के अनुपालन नियमों के प्रति उनकी अपनी ज़िम्मेदारी कितनी है।
आर्थिक पहलू और आगे क्या देखना है
सुरक्षा परीक्षण ढांचा अमोदेई के निबंध का एकमात्र नीतिगत आयाम नहीं है। Inside AI Policy के कवरेज के अनुसार, प्रस्तावों में विपत्तिपूर्ण जोखिम श्रेणियों के साथ-साथ आर्थिक अनिश्चितताओं को भी संबोधित किया गया है, जो संकेत देता है कि अमोदेई तेज़ AI क्षमता वृद्धि से होने वाले आर्थिक व्यवधान को भी एक ऐसी नीति समस्या के रूप में देखते हैं जिसे सुरक्षा प्रश्नों के साथ-साथ संरचित ध्यान की आवश्यकता है। निबंध इन्हें अलग-अलग बातचीत के रूप में नहीं देखता; फ्रेमिंग दोनों को एक ही घातांकीय क्षमता वक्र के परिणामों के रूप में स्थापित करती है।
सीखने वालों और व्यावसायिकों के लिए, यह निबंध नियामक बहस में आपकी स्थिति चाहे जो भी हो, अमोदेई की साइट पर पूरा पढ़ने लायक है। चार जोखिम श्रेणियां अमूर्त नहीं हैं: साइबर सुरक्षा अपग्रेड, बायोसिक्योरिटी जोखिम, स्वायत्त लक्ष्य-अनुसरण, और स्व-त्वरित R&D — ये सभी प्रकाशित मूल्यांकन ढांचों वाले सक्रिय शोध क्षेत्र हैं। प्रत्येक क्षेत्र में ऑडिटर वास्तव में क्या परीक्षण करेंगे यह समझना अब करियर के लिहाज़ से एक प्रासंगिक कौशल है। अगर यह ढांचा या इस जैसा कुछ कानूनी रूप से आगे बढ़ता है, तो उन चार श्रेणियों के खिलाफ निर्माण और मूल्यांकन करना जानने वाले लोग ही वे होंगे जो मानक लिखे जाते समय कमरे में मौजूद होंगे।
स्रोत
- Dario Amodei Demands Power to Block Unsafe AI a Day After Claude Fable 5 Launch(नए टैब में खुलता है)
- AI risks are here, time for tough rules: Anthropic CEO Dario Amodei(नए टैब में खुलता है)
- Anthropic CEO calls for FAA-style regulation of powerful AI models(नए टैब में खुलता है)
- Anthropic's Amodei unveils proposals on confronting catastrophic ...(नए टैब में खुलता है)
- Anthropic CEO: Government should have power to block dangerous AI deployments - AOL(नए टैब में खुलता है)
- Anthropic's Dario Amodei proposes mandatory third-party safety testing for frontier AI models to manage exponential capability growth · Digg(नए टैब में खुलता है)
- Anthropic backs mandatory testing for frontier AI models - POLITICO(नए टैब में खुलता है)
स्रोत
- Dario Amodei Demands Power to Block Unsafe AI a Day After Claude Fable 5 Launch(नए टैब में खुलता है)
- AI risks are here, time for tough rules: Anthropic CEO Dario Amodei(नए टैब में खुलता है)
- Anthropic CEO calls for FAA-style regulation of powerful AI models(नए टैब में खुलता है)
- Anthropic's Amodei unveils proposals on confronting catastrophic ...(नए टैब में खुलता है)
- Anthropic CEO: Government should have power to block dangerous AI deployments - AOL(नए टैब में खुलता है)
- Anthropic's Dario Amodei proposes mandatory third-party safety testing for frontier AI models to manage exponential capability growth · Digg(नए टैब में खुलता है)
- Anthropic CEO Calls for Mandatory Safety Tests ...(नए टैब में खुलता है)
- Anthropic CEO: Government should have power to block dangerous ...(नए टैब में खुलता है)
- Anthropic CEO Says Mandatory Safety Tests Needed for AI Models(नए टैब में खुलता है)
- Anthropic backs mandatory testing for frontier AI models - POLITICO(नए टैब में खुलता है)