एक ऐसी दुनिया की कल्पना करें जहां कोई भी फोटोशॉप सीख सकता है, लेकिन इससे जुड़ी तकनीकीताओं से निपटने के बिना। एक नया टूल जो जनरेटिव एआई की शक्ति का उपयोग करता है, लोगों को ऐसा करने की अनुमति देता है। ड्रैगगैन से मिलें, एक उपयोगकर्ता के अनुकूल उपकरण जो व्यक्तियों को सरल बिंदु और ड्रैग नियंत्रणों का उपयोग करके छवियों में महत्वपूर्ण परिवर्तन करने में सक्षम बनाता है।
जैसा कि एक शोध पत्र में बताया गया है, ड्रैगगैन उपयोगकर्ताओं को एक छवि पर एक बिंदु छोड़ने, संरचना और पूरे पिक्सेल को बदलने में सक्षम बनाता है। यह इसे डल-ई और मिडजर्नी जैसे अन्य लोकप्रिय जनरेटिव एआई इमेज टूल्स से अलग करता है, जो अत्यधिक विशिष्ट संकेतों को संसाधित करने में सक्षम होते हुए भी वांछित पोज़ या लेआउट को सटीक रूप से आउटपुट नहीं कर सकते हैं।
आरआईपी फोटोशॉप।
बस कुछ ही क्लिक में, आप किसी भी छवि को ठीक उसी तरह से संपादित करने में सक्षम होंगे जैसा आप चाहते हैं। ????pic.twitter.com/Nck3i50Mwb
– लोरेंजो ग्रीन 〰️ (@mrgreen) 19 मई, 2023
पेपर में उदाहरण एक शेर की छवि दिखाते हैं जहां उसका मुंह बंद करने के लिए उसके मुंह को बंद कर दिया जाता है, एक कार की तस्वीर को बदल दिया जाता है ताकि ऐसा लगे कि इसे पूरी तरह से अलग कोण से शूट किया गया है, और एक पहाड़ अपनी ऊंचाई से दोगुना बढ़ा हुआ है। इस तरह के महत्वपूर्ण संपादन के बावजूद, छवि जेनेरेटिव एआई की शक्ति के कारण वास्तविक दिखती है।
इसकी प्रभावशाली क्षमताओं से परे, ड्रैगगैन शोध पत्र उपकरण के सबसे बड़े लाभ – इसके इंटरफ़ेस की सरलता और सहजता पर जोर देता है। सेकंड के एक मामले में, उपयोगकर्ता अंतर्निहित तकनीक का पता लगाने की आवश्यकता के बिना कार्यक्षमता को समझ सकते हैं।
इंटरफ़ेस सभी एक छवि के लिए एक प्रारंभिक बिंदु और एक समाप्ति बिंदु जोड़ने के बारे में है। उदाहरण के लिए, किसी व्यक्ति के चेहरे पर मुस्कान लाने के लिए, उपयोगकर्ता अपने मुंह के कोनों पर दो बिंदु जोड़ सकते हैं और दो अतिरिक्त बिंदु थोड़ी दूर पर जोड़ सकते हैं। स्टार्ट बटन दबाएं और टूल एनिमेटेड रूप से मुंह को शुरुआती बिंदुओं से अंत बिंदुओं तक फैलाता है।
इस बीच, जेनेरेटिव एआई यथार्थवाद को संरक्षित करते हुए उत्पन्न होने वाले किसी भी अंतराल को संभालता है। शोध पत्र में कहा गया है, “हमारा दृष्टिकोण एक शेर के मुंह के अंदर के दांतों की तरह दबी हुई सामग्री को भ्रमित कर सकता है, और वस्तु की कठोरता के बाद विकृत हो सकता है।”
ड्रैगगैन एक मास्किंग सुविधा भी प्रदान करता है जो उपयोगकर्ताओं को उस छवि के विशिष्ट भागों को उजागर करने की अनुमति देता है जिसे वे बदलना चाहते हैं जबकि बाकी को अछूता छोड़ देते हैं।
कुल मिलाकर, ड्रैगगैन छवि निर्माण उपकरणों की सबसे बड़ी कमी को दूर करने में मदद कर सकता है – उनकी यादृच्छिक प्रकृति। यदि ड्रैगगैन को इमेज जनरेशन टूल्स के साथ जोड़ा जाता है, तो उपयोगकर्ता उस छवि के करीब आउटपुट प्राप्त करने में सक्षम होंगे जो उनके मन में है। उपकरण अभी केवल एक डेमो है, लेकिन इसके अनुप्रयोग यह देखना दिलचस्प होगा कि यह सार्वजनिक रूप से कब उपलब्ध होगा।
More Stories
WWE रॉ 2025 में नेटफ्लिक्स पर लाइव स्ट्रीम होगी: आपको क्या जानना चाहिए
सिर्फ 999 रुपये में मिलेगा नॉइज़ बड्स कनेक्ट 2, एक बार चार्ज करने पर 50 घंटे तक सुनेंगे म्यूजिक
हज़ारों उपयोगकर्ताओं के लिए आज दूसरी बार डाउन होने के बाद Reddit वापस आ गया –