
इस लेख में (4)
OpenAI का उलटा दांव: सबसे अच्छे तालों की चाबियाँ सबसे अच्छे तालेबाजों को दो
मुख्य बातें
- GPT-5.5-Cyber ने CyberGym पर 85.6% स्कोर किया है और इसे केवल सत्यापित रक्षकों तक सीमित रखा गया है; क्षमता और पहुँच नियंत्रण को डिज़ाइन द्वारा अलग किया जा सकता है और किया जाना चाहिए।
- Patch the Planet ने cURL, Go और Python सहित 19+ ओपन-सोर्स प्रोजेक्ट्स में मर्ज किए गए पैच प्रदान किए हैं, जो यह साबित करता है कि AI-सहायता प्राप्त ऑडिटिंग अब वास्तविक अपस्ट्रीम सुधार उत्पन्न करती है।
- AI-जनित सुरक्षा पैच की समीक्षा करना और उनमें योगदान देना एक व्यावहारिक, उच्च-मांग वाला कौशल है क्योंकि रक्षक AI हथियारों की दौड़ तेज़ होती जा रही है।
OpenAI का Daybreak प्लेटफ़ॉर्म और Patch the Planet पहल यह दांव लगाती है कि सत्यापित रक्षकों के हाथों में अधिक सक्षम AI को आक्रामक रूप से तैनात करना, उसे प्रतिबंधित करने से बेहतर है।
OpenAI का Daybreak प्लेटफ़ॉर्म और Patch the Planet पहल इस सोच पर दांव लगाती है कि अधिक सक्षम AI को सत्यापित रक्षकों के हाथों में आक्रामक रूप से तैनात करना, उसे प्रतिबंधित करने से बेहतर है।
कल्पना कीजिए कि आपके शहर में ताला तोड़ने की एक गंभीर समस्या है। एक विचारधारा कहती है: सभी ताला-तोड़ने के औज़ार जब्त कर लो। दूसरी कहती है: सबसे अच्छे औज़ार सबसे कुशल लॉकस्मिथ को दो, और फिर उनसे शहर के हर ताले को तुरंत ठीक करवाओ। OpenAI ने अभी-अभी बहुत ज़ोर से दूसरे विकल्प के पक्ष में वोट किया है। 22 जून 2026 को, कंपनी ने अपना Daybreak साइबरसिक्योरिटी प्लेटफ़ॉर्म, GPT-5.5-Cyber का पूर्ण संस्करण, और Patch the Planet लॉन्च करने की घोषणा की — यह व्यापक रूप से उपयोग होने वाले ओपन-सोर्स सॉफ़्टवेयर में कमज़ोरियाँ खोजने और ठीक करने का एक समन्वित, बड़े पैमाने का प्रयास है। यह एक असामान्य रणनीति है: सबसे सक्षम AI सुरक्षा मॉडल को तैनात करो, लेकिन केवल उन्हीं लोगों के लिए जिनकी जाँच-परख हो चुकी है कि वे इसका दुरुपयोग नहीं करेंगे, और फिर उस क्षमता का उपयोग उस सॉफ़्टवेयर को पैच करने में करो जिस पर सभी पहले से निर्भर हैं।
GPT-5.5-Cyber वास्तव में क्या है (और संख्याओं का क्या मतलब है)
GPT-5.5-Cyber कोई सामान्य-उद्देश्य वाला मॉडल नहीं है जिस पर बस "साइबर" का लेबल चिपका दिया गया हो। Axios के अनुसार, यह एक प्रतिबंधित-पहुँच वाला मॉडल है जो केवल जाँचे-परखे साइबरसिक्योरिटी कंपनियों और शोधकर्ताओं के लिए उपलब्ध है, और 22 जून का अपडेट इसे Daybreak रोलआउट के हिस्से के रूप में अधिक अनुमति देने वाला और अधिक सक्षम बनाता है। यह अंतर महत्वपूर्ण है: यह कोई ऐसा API नहीं है जिसे आप क्रेडिट कार्ड से अनलॉक कर सकें।
बेंचमार्क पर, संख्याएँ इतनी विशिष्ट हैं कि उन्हें ध्यान से देखना उचित है। AI Weekly के अनुसार, GPT-5.5-Cyber CyberGym पर 85.6% स्कोर करता है, जो उसी मूल्यांकन पर GPT-5.5 के पिछले अंक 81.8% से अधिक है। मॉडल परिवार की क्षमताओं की स्वतंत्र पुष्टि के लिए, UK के AI Safety Institute ने अप्रैल 2026 में अपना मूल्यांकन प्रकाशित किया, जिसमें निष्कर्ष निकाला गया कि GPT-5.5 "हमारे साइबर कार्यों पर परीक्षण किए गए सबसे मज़बूत मॉडलों में से एक है" और यह उनके बहु-चरणीय साइबर-अटैक सिमुलेशन को शुरू से अंत तक हल करने वाला दूसरा मॉडल था। रिकॉर्ड के लिए बता दें, पहला Anthropic के Claude Mythos Preview का प्रारंभिक स्नैपशॉट था।
तो: दो फ्रंटियर मॉडल, दोनों अब एक पूरे सिमुलेटेड कॉर्पोरेट नेटवर्क अटैक को बिना किसी इंसान की सहायता के पूरा करने में सक्षम हैं। यही वह खतरे का परिदृश्य है जिसका OpenAI स्पष्ट रूप से जवाब दे रहा है।
ट्रस्टेड एक्सेस आर्किटेक्चर: ताला-तोड़ने के औज़ार किसे मिलते हैं
OpenAI की रणनीति में "ट्रस्टेड एक्सेस" की अवधारणा बहुत महत्वपूर्ण भूमिका निभा रही है, और इसे यांत्रिक रूप से समझना उचित है। साइबर के लिए ट्रस्टेड एक्सेस बढ़ाने पर OpenAI के अपने दस्तावेज़ीकरण के अनुसार, यह दृष्टिकोण रक्षात्मक पारिस्थितिकी तंत्र की विभिन्न परतों की सेवा के लिए डिज़ाइन किया गया है — एंटरप्राइज़ सुरक्षा टीमों से लेकर स्वतंत्र शोधकर्ताओं तक — जहाँ पहुँच एक साधारण API key के बजाय जाँच-परख द्वारा नियंत्रित होती है। यह एक जानबूझकर किया गया परिनियोजन विकल्प है, न कि व्यापक लॉन्च से पहले की कोई अस्थायी पाबंदी।
जैसा कि OpenAI Daybreak घोषणा के माध्यम से वर्णन करता है, इसका तर्क यह है कि साइबर रक्षा एक ऐसे मोड़ पर है जहाँ केवल कमज़ोरियाँ खोजने से आगे बढ़कर end-to-end पैच ऑटोमेशन की ओर जाने के लिए मॉडल को एक सामान्य-उद्देश्य असिस्टेंट से अधिक आक्रामक क्षमता के साथ काम करना होगा। Daybreak प्लेटफ़ॉर्म ने Codex Security भी पेश किया — एक स्कैनर जो खोज की गई समस्याओं को सुधारों में बदलने के लिए डिज़ाइन किया गया है, जो पहचान और निराकरण के बीच के चक्र को पूरा करता है। किसी सक्षम मॉडल को एक जाँचे-परखे रक्षक को देना और उसे तुरंत वास्तविक दुनिया के कोड पर लगाना — यही दाँव लगाया गया है।
Patch the Planet: दर्जनों इंजीनियर, 30+ प्रोजेक्ट, और वास्तव में मर्ज हुए फ़िक्स
इस घोषणा को एक सामान्य बेंचमार्क प्रेस रिलीज़ से अलग करने वाली बात Patch the Planet पहल है, और इसे ठोस रूप देने का अधिकांश श्रेय Trail of Bits को जाता है। Trail of Bits ब्लॉग के अनुसार, इस कार्यक्रम ने Trail of Bits के दर्जनों इंजीनियरों का शेड्यूल खाली कराया, उन्हें ओपन-सोर्स अनुरक्षकों के साथ जोड़ा, और GPT-5.5-Cyber को महत्वपूर्ण ओपन-सोर्स लक्ष्यों पर केंद्रित किया। परिणाम, जैसा AI Weekly रिपोर्ट करता है, Trail of Bits इंजीनियर 19 ओपन-सोर्स प्रोजेक्ट में पूर्णकालिक रूप से काम कर रहे हैं, जहाँ सैकड़ों समस्याएँ मिली हैं और दर्जनों पैच पहले से ही प्रोडक्शन कोड में मर्ज हो चुके हैं।
इसका दायरा उस एकल स्प्रिंट से भी व्यापक है। AI Weekly के अनुसार, Patch the Planet में cURL, Go, Python, और Sigstore सहित 30 से अधिक प्रोजेक्ट शामिल हैं — जिनमें Trail of Bits के सह-संस्थापित प्रोजेक्ट भी हैं। Trail of Bits ने अपने ब्लॉग पोस्ट में जो अंतर बताया है वह महत्वपूर्ण है और इसे ध्यान में रखने योग्य है: यह कार्यक्रम केवल बग रिपोर्ट नहीं, बल्कि पैच लेकर आया। यह एक महत्वपूर्ण बदलाव है। जो भी व्यक्ति किसी स्वयंसेवक-अनुरक्षित लाइब्रेरी के खिलाफ एक सुनियोजित CVE दाखिल करके उसे छह महीने तक बिना किसी प्रतिक्रिया के पड़ा देखता आया है, वह समझता है कि पैच-सहित मॉडल केवल प्रकटीकरण वाले दृष्टिकोणों की तुलना में एक सार्थक उन्नति क्यों है।
प्रैक्टिशनर और सीखने वालों के लिए मुख्य बातें
यदि आप साइबरसिक्योरिटी, सॉफ़्टवेयर इंजीनियरिंग, या AI सिस्टम का अध्ययन कर रहे हैं, तो यहाँ तीन बातें हैं जो आपको ज़रूर आत्मसात करनी चाहिए।
पहली, CyberGym जैसे डोमेन-विशिष्ट मूल्यांकन पर बेंचमार्क स्कोर किसी विशेष काम के लिए टूल का मूल्यांकन करते समय सामान्य लीडरबोर्ड रैंकिंग की तुलना में अधिक जानकारीपूर्ण होते हैं; आक्रामक सुरक्षा तर्क के लिए ट्यून किया गया मॉडल उन कार्यों पर एक सामान्य मॉडल से बेहतर प्रदर्शन करेगा, और वह अंतर और बढ़ेगा।
दूसरी, OpenAI जो ट्रस्टेड-एक्सेस टियरिंग तैनात कर रहा है वह खुद एक डिज़ाइन पैटर्न है जिसे अध्ययन करना उचित है: क्षमता और एक्सेस नियंत्रण को अलग किया जा सकता है, और वह अलगाव एक नीति और इंजीनियरिंग निर्णय है, न कि केवल कानूनी।
तीसरी और सबसे व्यावहारिक बात, Patch the Planet एक वास्तविक दुनिया का प्रदर्शन है कि AI-सहायता प्राप्त कोड ऑडिटिंग अब महत्वपूर्ण इंफ्रास्ट्रक्चर प्रोजेक्ट में मर्ज किए गए अपस्ट्रीम पैच उत्पन्न करने में सक्षम है — जिसका अर्थ है कि AI-जनित सुरक्षा पैच की समीक्षा करने, उन्हें संदर्भ देने और उनमें योगदान करने का कौशल अभी विकसित करना वास्तव में उपयोगी है।
देखते रहें कि अन्य फ्रंटियर लैब कैसे प्रतिक्रिया देती हैं। AISI की अप्रैल 2026 की यह टिप्पणी कि Claude Mythos Preview अपने end-to-end कॉर्पोरेट नेटवर्क अटैक सिमुलेशन को पूरा करने वाला पहला मॉडल था — Axios द्वारा रिपोर्ट किए गए अनुसार Anthropic के अमेरिकी सरकार के साथ चल रहे संबंधों के साथ मिलकर — यह सुझाव देती है कि डिफेंडर AI रेस में कम से कम दो गंभीर प्रतिस्पर्धी हैं। दिलचस्प सवाल यह नहीं है कि अगली तिमाही में CyberGym पर कौन सा मॉडल सबसे ऊँचा स्कोर करेगा। सवाल यह है कि क्या OpenAI और Trail of Bits जो वेटेड-एक्सेस, पैच-फर्स्ट मॉडल पायलट कर रहे हैं वह उद्योग का टेम्पलेट बनेगा, या कोई क्षमता को व्यापक रूप से जारी करके और परिणाम स्वीकार करके तेज़ रास्ता खोज लेगा।
ताला-तोड़ने के औज़ार पहले से बाहर हैं। बचा हुआ एकमात्र सवाल यह है कि उन्हें पहले कौन इस्तेमाल करता है।