इस लेख में (4)
Pixi आपके कैमरा फ़ीड को क्लाउड से दूर रखता है। यह एक डिज़ाइन विकल्प है जिसे परखना ज़रूरी है।
मुख्य बातें
- ऑन-डिवाइस AI प्रोसेसिंग आपके कैमरा फ़ीड को कंपनी के सर्वर तक पहुँचने से रोकती है, लेकिन मॉडल के प्रशिक्षित व्यवहार और अनुमान तर्क अपारदर्शी बने रहते हैं। यह गोपनीयता के प्रश्न को स्थानांतरित करता है; यह उसे समाप्त नहीं करता।
- Pixi की आर्किटेक्चर दर्शाती है कि रियल-टाइम, पर्यावरण-जागरूक AI अनुमान पहले से ही वर्तमान iPhone हार्डवेयर पर चलता है। कैमरा-संबंधित ऐप बनाने वालों को इसे एक व्यावहारिक डिज़ाइन विकल्प मानना चाहिए, न कि भविष्य की आकांक्षा।
- किसी भी 'ऑन-डिवाइस' गोपनीयता दावे का मूल्यांकन करते समय, पूछें कि मॉडल को किसने प्रशिक्षित किया, OS को कौन नियंत्रित करता है, और चिप का मालिक कौन है। 'डेटा आपके फ़ोन पर रहता है' और 'आप डेटा को नियंत्रित करते हैं' एक ही कथन नहीं हैं।
वह AR मैसेजिंग स्टार्टअप जिसने 18 जून को iMessage के अंदर लॉन्च किया, उसने एक ऐसा आर्किटेक्चरल दांव लगाया जो पहली नज़र में उल्टा लगता है। यह क्यों मायने रखता है, यह समझना सिर्फ एक ऐप से कहीं आगे जाता है।
वह AR मैसेजिंग स्टार्टअप जो 18 जून को iMessage के अंदर लॉन्च हुआ, उसने एक ऐसा आर्किटेक्चरल दांव लगाया जो पहली नज़र में उल्टा लगता है। यह क्यों मायने रखता है, यह समझना सिर्फ एक ऐप से कहीं आगे जाता है।
अभी किसी के iMessage थ्रेड में एक वर्चुअल बिल्ली रह रही है, और उसने अभी-अभी एक असली कुत्ते पर प्रतिक्रिया दी जो कमरे में से गुज़रा। तीन साल पहले यह वाक्य बेतुका लगता। आज यह एक प्रोडक्ट लॉन्च है। 18 जून, 2026 को Pixi नाम के एक स्टार्टअप ने अपना iOS ऐप App Store पर शिप किया, और उन्होंने जो बनाया है वह सच में अजीब है — लेकिन सबसे अच्छे तरीके से। अजीब इसलिए नहीं कि इसमें ऑगमेंटेड रियलिटी के किरदार हैं, जो काफी आनंददायक हैं पर नए नहीं। अजीब इसलिए कि सोचने का काम कहाँ होता है। TechCrunch की Lauren Forristal की रिपोर्टिंग के अनुसार, Pixi में सारी विज़ुअल और ऑडियो प्रोसेसिंग डिवाइस पर ही होती है — कभी फ़ोन से बाहर नहीं जाती। कंपनी इसे एक प्राइवेसी निर्णय के रूप में पेश करती है। लेकिन अगर आप इस आर्किटेक्चर के कॉन्सेप्ट पर थोड़ा समय बिताएं, तो आपको एहसास होने लगता है कि यह कुछ और भी है: एक थीसिस कि इस सबसे अंतरंग डेटा पर किस पर भरोसा किया जाना चाहिए जो एक कैमरे से लैस AI तैयार कर सकता है — यानी आपके घर, आपके चेहरे, और आपके साथ कमरे में मौजूद हर व्यक्ति की लाइव फ़ीड। वर्चुअल बिल्ली वाले मज़ेदार हिस्से पर आने से पहले यह सवाल एक पल के लिए सोचने लायक है।
Pixi ने वास्तव में क्या बनाया
Pixi के संस्थापक Mark Drummond, जिन्होंने पहले DreamWorks Animation और Apple में काम किया था, ने ऐप को इस तरह डिज़ाइन किया कि यह डिजिटल कम्युनिकेशन में — जैसा कि TechCrunch रिपोर्ट के aVenture News सिंडिकेशन के अनुसार उन्होंने बताया — उपस्थिति और सहजता का एक बड़ा एहसास लाए। इसका तंत्र iMessage-नेटिव अनुभव है: एक व्यक्ति दूसरे को एक AR किरदार भेजता है, और प्राप्तकर्ता उसे अपने iPhone कैमरे के ज़रिए खोलता है, जहाँ वह किरदार उनके भौतिक वातावरण में जीवंत हो जाता है। ये स्थिर स्टिकर या लूपिंग GIF नहीं हैं। ये AI-संचालित इकाइयाँ हैं जो रियल टाइम में कैमरा जो देखता है उस पर प्रतिक्रिया करती हैं। एक वर्चुअल बिल्ली एक असली कुत्ते को नोटिस करती है। एक किरदार हलचल, रोशनी और आस-पास के लोगों पर प्रतिक्रिया देता है।
Snap सालों से AR फ़िल्टर और लेंस बनाता आया है, जैसा कि TechCrunch ने लॉन्च की कवरेज में बताया। Pixi जो दावा कर रहा है वह फ़र्क है — AR के साथ ऑन-डिवाइस AI इन्फरेंस का संयोजन, ताकि किरदार अपने परिवेश को वास्तव में समझ सकें न कि बस उस पर ओवरले हों। यह अंतर आर्किटेक्चरल रूप से मायने रखता है। समझने के लिए प्रोसेसिंग चाहिए। प्रोसेसिंग के लिए कम्प्यूट चाहिए। और यह चुनाव कि वह कम्प्यूट कहाँ होता है — फ़ोन पर बनाम डेटा सेंटर में — एक तटस्थ इंजीनियरिंग प्राथमिकता नहीं है। यह एक मूल्यों का बयान है।
उसी दिन का बिज़नेस वायर अनाउंसमेंट अनुभव को ऐसा बताता है जो किरदारों को "अपने परिवेश पर प्रतिक्रिया करने, लोगों के साथ बातचीत करने और रियल टाइम में जवाब देने" की सुविधा देता है, और कंपनी ऑन-डिवाइस प्रोसेसिंग को वह तंत्र बताती है जो यूज़र की प्राइवेसी सुरक्षित रखता है। फ्रेमिंग साफ़ है। लेकिन साफ़ फ्रेमिंग को दूसरी नज़र की ज़रूरत होती है।
प्राइवेसी का तर्क और उसकी छुपी हुई मान्यताएं
यहाँ बताते हैं कि ऑन-डिवाइस प्रोसेसिंग वास्तव में क्या अच्छा करती है। यह रॉ सेंसर डेटा को — आपके कैमरे के असली पिक्सल, आपके माइक्रोफ़ोन की असली ऑडियो वेवफ़ॉर्म — किसी रिमोट सर्वर तक जाने से रोकती है। यह कोई छोटी बात नहीं है। ACLU ने सुरक्षित मैसेजिंग के लिए AI के संरचनात्मक जोखिम के बारे में स्पष्ट रूप से लिखा है, यह नोट करते हुए कि iMessage जैसे ऐप्स का बुनियादी वादा यह है कि केवल प्रेषक और प्राप्तकर्ता ही संदेश पढ़ सकते हैं। जिस पल AI प्रोसेसिंग तस्वीर में आती है और डेटा को किसी थर्ड-पार्टी सर्वर से रूट करती है, वह वादा उन तरीकों से जटिल हो जाता है जिन्हें बाहर से ऑडिट करना मुश्किल है।
Pixi का आर्किटेक्चर उस खास जोखिम से बचता है। अगर इन्फरेंस मॉडल लोकली चलता है, तो कंपनी को आपकी कैमरा फ़ीड कभी नहीं मिलती। उसे सबपीना नहीं किया जा सकता, उसे ब्रीच नहीं किया जा सकता, और वह चुपचाप मॉडल ट्रेनिंग के लिए इसका इस्तेमाल नहीं कर सकती। ये वास्तविक, ठोस फ़ायदे हैं जो इस दृष्टिकोण को क्लाउड-डिपेंडेंट AI फ़ीचर्स से अलग करते हैं, जो पिछले तीन सालों में लॉन्च हुए लगभग हर दूसरे कंज़्यूमर AI प्रोडक्ट में डिफ़ॉल्ट बन गए हैं।
लेकिन ऑन-डिवाइस प्रोसेसिंग सवाल का जवाब देने के बजाय उसे बदल देती है। मॉडल खुद अभी भी आपके डिवाइस पर रहता है। इसे कहीं, किसी चीज़ पर, किसी ने ट्रेन किया था। इसके द्वारा प्रदर्शित व्यवहार — यह क्या नोटिस करता है, यह किस पर प्रतिक्रिया करता है, यह आपके परिवेश के बारे में क्या "समझने" का चुनाव करता है — वह सब उस मॉडल में बेक हो जाता है इससे पहले कि वह कभी आपके फ़ोन तक पहुंचे। आपने डेटा-एक्सफ़िल्ट्रेशन के जोखिम को एक अलग किस्म की अपारदर्शिता से बदल दिया है: इन्फरेंस लॉजिक की अपारदर्शिता जिसे आप इंस्पेक्ट नहीं कर सकते।
यह Pixi के बनाए के खिलाफ़ तर्क नहीं है। यह तर्क है कि "ऑन-डिवाइस" प्राइवेसी बातचीत की शुरुआत होनी चाहिए, अंत नहीं।
बिल्डर्स को इस आर्किटेक्चर पर ध्यान क्यों देना चाहिए
प्राइवेसी की फ़िलॉसफ़ी को एक पल के लिए अलग रखें और इसे एक प्रोडक्ट डिज़ाइन समस्या के रूप में देखें। Drummond की पृष्ठभूमि DreamWorks और Apple दोनों में फैली हुई है — दो संस्थाएं जिनका हार्डवेयर कंस्ट्रेंट्स से बहुत अलग रिश्ता है। Apple ने विशेष रूप से एक दशक का बेहतर हिस्सा अपने चिप्स में Neural Engine बनाने में लगाया है, ठीक इसलिए क्योंकि उसने ऐसी दुनिया का अनुमान लगाया था जहाँ meaningful AI इन्फरेंस एज पर होना ज़रूरी था, न कि किसी सर्वर के राउंड-ट्रिप में। iPhone 15 और 16 लाइन, अन्य चीज़ों के अलावा, इन्फरेंस मशीनें हैं जो उपयोग किए जाने का इंतज़ार कर रही हैं।
Pixi उन पहले कंज़्यूमर सोशल ऐप्लिकेशन में से एक है जो उस हार्डवेयर क्षमता को एक प्राथमिक डिज़ाइन कंस्ट्रेंट मानता है न कि बाद की सोच। कंज़्यूमर ऐप्स में कैमरे से जुड़े ज़्यादातर AI फ़ीचर्स — फ़िल्टर, ऑब्जेक्ट रिकग्निशन, सीन डिटेक्शन — अभी भी एक lazy आर्किटेक्चर का पालन करते हैं: फ्रेम को क्लाउड एंडपॉइंट पर शिप करो, नतीजा वापस लो, रेंडर करो। यह पाइपलाइन अच्छे कनेक्शन पर काफ़ी तेज़ है और ज़्यादातर यूज़र्स के लिए अदृश्य है। लेकिन यह लेटेंसी लाता है, यह डेटा एक्सपोज़र का जोखिम लाता है, और स्केल पर यह इन्फ्रास्ट्रक्चर लागत लाता है जो ऑन-डिवाइस प्रोसेसिंग में सीधे नहीं होती।
अभी कैमरे से जुड़ा कोई कंज़्यूमर ऐप बनाने वाले किसी के लिए भी, 18 जून को Pixi का लॉन्च एक प्राइवेसी कहानी के रूप में नहीं बल्कि एक प्रदर्शन के रूप में देखने लायक है — कि रियल-टाइम, पर्यावरण से अवगत AI इन्फरेंस मौजूदा iPhone हार्डवेयर पर लोकली चल सकता है। यह एक क्षमता अनलॉक है जिसके साथ ज़्यादातर प्रोडक्ट रोडमैप अभी तक नहीं पहुंचे हैं।
वह सवाल जो कोई पूरी तरह नहीं पूछ रहा
गहरा मुद्दा — और वह जो इस लॉन्च को एक सामान्य AR नवीनता से ज़्यादा दिलचस्प बनाता है — यह है कि Pixi iMessage के अंदर रहता है। एक स्टैंडअलोन ऐप के रूप में नहीं जिसे आप खोलते हैं, बल्कि कुछ ऐसे जो Apple की मैसेजिंग इन्फ्रास्ट्रक्चर के भीतर काम करता है। यह संदर्भ इस बारे में बहुत मायने रखता है कि हम "निजी" का क्या अर्थ समझते हैं।
Apple iMessage को नियंत्रित करता है। Apple App Store डिस्ट्रीब्यूशन को नियंत्रित करता है जिसने Pixi को आपके फ़ोन पर पहुंचाया। Apple उन APIs को नियंत्रित करता है जो एक iMessage एक्सटेंशन को आपके कैमरे तक पहुंचने की अनुमति देते हैं। सुरक्षित मैसेजिंग के बारे में ACLU का फ्रेमिंग यहाँ उपयोगी है: बेसलाइन वादा यह है कि केवल बातचीत में भाग लेने वाले ही इसकी सामग्री तक पहुंच सकते हैं। Pixi का ऑन-डिवाइस मॉडल डेटा को Pixi के सर्वर तक जाने से बचाता है। लेकिन यह एक ऐसे इकोसिस्टम के भीतर काम करता है जहाँ प्लेटफ़ॉर्म के मालिक की उस ऑपरेशन की स्थितियों में अपनी गहरी दृश्यता है।
यह कोई आरोप नहीं है। Apple का प्राइवेसी पर अपने ज़्यादातर साथियों की तुलना में बेहतर ट्रैक रिकॉर्ड है। लेकिन ऑन-डिवाइस AI के उत्साह में एक संरचनात्मक सवाल छुपा हुआ है जो इंडस्ट्री अभी तक काफ़ी ज़ोर से नहीं पूछ रही: जब हम "डेटा आपका फ़ोन नहीं छोड़ता" का जश्न मनाते हैं, तो हम वास्तव में किसकी फ़ोन इन्फ्रास्ट्रक्चर की बात कर रहे हैं? चिप एक कंपनी ने बनाई, OS दूसरी ने लिखा, मॉडल तीसरी ने ट्रेन किया, और ऐप चौथी ने अप्रूव किया। ऑन-डिवाइस एक meaningful कंस्ट्रेंट है। यह यूज़र कंट्रोल के बराबर नहीं है।
Pixi ने कुछ वास्तव में नया बनाया है: एक AR मैसेजिंग अनुभव जहाँ एक वर्चुअल प्राणी आपके असली परिवेश को समझता है बिना उस परिवेश को कहीं अपलोड किए। यह एक वास्तविक आर्किटेक्चरल उपलब्धि है, और इसे ऐसे ही श्रेय मिलना चाहिए। Drummond और उनकी टीम ने एक विचारशील चुनाव किया है जो कंज़्यूमर AI की बातचीत को डिफ़ॉल्ट की तुलना में अधिक प्राइवेसी-सम्मानजनक दिशा में ले जाता है।
लेकिन आपके कुत्ते पर प्रतिक्रिया करती वर्चुअल बिल्ली भी — इस पर निर्भर करते हुए कि आप इसे कैसे देखते हैं — इस बात का काफ़ी अच्छा चित्रण है कि एक लोकल AI मॉडल कभी सर्वर को एक बाइट भेजे बिना आपकी ज़िंदगी के बारे में कितना कुछ अनुमान लगा सकता है। डेटा आपके फ़ोन पर रहता है। जो निष्कर्ष यह निकालता है, जो व्यवहार यह पहचानना सीखता है, जो संदर्भ यह आपके घर और उसमें रहने वाले लोगों के बारे में बनाता है — वह बिल्कुल अलग मामला है।
तो यहाँ वह सवाल है जो ऑन-डिवाइस AI प्रोडक्ट्स की अगली लहर में साथ ले जाने लायक है: अगर मॉडल सब कुछ जानता है लेकिन कुछ नहीं भेजता, तो यह वास्तव में किसकी रक्षा करता है?
