Lok Shakti

Nationalism Always Empower People

एआई आर्ट टूल मिडजर्नी के पास ‘क्या हुआ अगर’ के सभी जवाब हैं

नासा द्वारा ब्रह्मांड की हाल ही में जारी की गई छवियों से प्रेरित होकर, शोध प्रयोगशाला मिडजर्नी के आर्टिफिशियल इंटेलिजेंस (एआई) उपकरण में मैंने जो पहला संकेत दिया, वह था “आकाशगंगाओं से घिरा एक अंतरिक्ष यान”। परिणाम, जैसा कि नीचे दिखाया गया है, अंतरिक्ष में निलंबित एक जहाज की एक छवि थी जो इसके चारों ओर ब्रह्मांड को प्रतिबिंबित करती प्रतीत होती है – संकेत के लिए काफी सच है।

आकाशगंगाओं से घिरा एक अंतरिक्ष यान (क्रेडिट: मिडजर्नी)

मिडजॉर्नी के संस्थापक डेविड होल्ज़ के लिए, जनरेटिव एआई का एक शक्तिशाली पहलू इसकी “भाषा के साथ एकीकरण करने की क्षमता” है, जहां हम “चीजों को बनाने के लिए एक उपकरण के रूप में भाषा का उपयोग कर सकते हैं”। सरल शब्दों में, जनरेटिव एआई समय के साथ विभिन्न स्रोतों से सीखे गए डेटासेट के आधार पर उपन्यास चित्र बनाने के लिए उपयोगकर्ता से कमांड का उपयोग करता है।

टेक्स्ट-टू-इमेज पीढ़ी के उदय ने ‘कलाकार’ की परिभाषा पर दार्शनिक प्रश्न भी उठाए हैं।

ब्रिटिश गणितज्ञ मार्कस डू सौतॉय ने अपनी पुस्तक द क्रिएटिविटी कोड (आर्ट एंड इनोवेशन इन द एज ऑफ एआई), 2019 में तर्क दिया है, “कला अंततः मानव स्वतंत्र इच्छा की अभिव्यक्ति है और जब तक कंप्यूटर के पास इसका अपना संस्करण नहीं होता, तब तक कला एक द्वारा बनाई गई कला है। कंप्यूटर हमेशा बनाने की मानवीय इच्छा के लिए वापस खोजा जा सकता है।” उनका कहना है कि अगर हम एक मशीन में “दिमाग” बनाते हैं, तो शायद यह उसके विचारों में एक झलक पेश करेगा। “लेकिन हम अभी भी सचेत कोड बनाने से एक लंबा रास्ता तय कर रहे हैं,” डु सौतोय ने निष्कर्ष निकाला।

इसी तरह, होल्ज़ ने नोट किया, “यह महत्वपूर्ण है कि हम इसे एआई ‘कलाकार’ के रूप में न समझें। हम इसे अपनी कल्पना को बढ़ाने के लिए एआई का उपयोग करने के बारे में अधिक सोचते हैं। यह जरूरी नहीं कि कला के बारे में हो बल्कि कल्पना के बारे में हो। हम पूछ रहे हैं, ‘क्या हुआ अगर’। एआई हमारी कल्पना शक्ति को बढ़ाता है।”

Midjourney अपने उपयोगकर्ताओं को अपने डिस्कॉर्ड सर्वर पर अपने संकेतों में फ़ीड करने की अनुमति देता है और फिर पाठ के समान चार छवियां उत्पन्न करता है। उपयोगकर्ता अधिक विविधताओं का पता लगाने और उच्च गुणवत्ता वाली छवि के लिए एकदम सही फिट को चुनने का विकल्प चुन सकता है। बॉट ने पिछले महीने ओपन बीटा में प्रवेश किया, जिससे उपयोगकर्ताओं को उनकी कल्पनाओं को जीवंत करने के लिए निश्चित संख्या में नि:शुल्क परीक्षण दिए गए। उत्पन्न छवियों को एनएफटी में भी ढाला जा सकता है, जिसके लिए, हाल तक, मिडजर्नी ने रॉयल्टी का शुल्क लिया था।

“यह लगभग दस लाख लोगों का एक विशाल समुदाय है जो सभी एक साथ चित्र बना रहे हैं, सपने देख रहे हैं और एक दूसरे से अलग हो रहे हैं। सभी संकेत सार्वजनिक हैं और हर कोई एक-दूसरे की छवियों को देख सकता है … यह बहुत ही अनोखा है, ”होल्ज़ ने indianexpress.com को बताया।

होल्ज़ ने 2010 में लीप मोशन की सह-स्थापना की, एक हैंड-ट्रैकिंग मोशन कैप्चर यूजर-इंटरफ़ेस कंपनी, और फोर्ब्स 30 अंडर 30 की 2014 की सूची में चित्रित किया गया था। अब वह एक छोटी स्व-वित्त पोषित अनुसंधान और डिजाइन लैब, मिडजॉर्नी चलाता है, जो 10 अन्य सहयोगियों के साथ एआई विज़ुअलाइज़ेशन टूल सहित विविध परियोजनाओं का एक समूह तलाश रहा है।

एआई बॉट को मिली प्रतिक्रिया के बारे में बताते हुए होल्ज कहते हैं, “बहुत से लोग बहुत खुश हैं और उत्पाद का उपयोग करना एक गहरा भावनात्मक अनुभव पाते हैं। लोग इसका इस्तेमाल प्रोजेक्ट से लेकर आर्ट थेरेपी तक हर चीज के लिए करते हैं। कुछ लोग ऐसे भी होते हैं जिनके मन में हमेशा कुछ बातें होती हैं लेकिन वे इसे पहले व्यक्त नहीं कर पाते थे। कुछ लोगों में वाचाघात जैसी स्थितियां होती हैं, जहां दिमाग चीजों की कल्पना नहीं कर सकता है, और वे अब अपने जीवन में पहली बार कल्पना करने के लिए बॉट का उपयोग कर रहे हैं। बहुत सारी खूबसूरत चीजें हो रही हैं।”

बॉट इस बात का भी ख्याल रखता है कि आपत्तिजनक इमेज बनाने के लिए प्लेटफॉर्म के दुरुपयोग को रोका जा सके। समुदाय दिशानिर्देश उपयोगकर्ताओं से “स्वाभाविक रूप से अपमानजनक, आक्रामक, या अन्यथा अपमानजनक” संकेतों का उपयोग करने से बचने के साथ-साथ “वयस्क सामग्री या गोर” उत्पन्न करने का आग्रह करते हैं। मिडजर्नी उन मध्यस्थों का भी उपयोग करता है जो नीतियों का उल्लंघन करने वाले लोगों पर नजर रखते हैं और उन्हें चेतावनी देते हैं या उन पर प्रतिबंध लगाते हैं। इसमें स्वचालित सामग्री मॉडरेशन भी है जहां सर्वर पर कुछ शब्द प्रतिबंधित हैं। एआई भी, उपयोगकर्ता डेटा से सीखता है, होल्ज़ बताते हैं। “अगर लोग कुछ पसंद नहीं करते हैं, तो यह उससे कम उत्पन्न करता है।”

मैंने अपने ट्विटर फ़ीड के माध्यम से एक सरसरी नज़र के दौरान मिडजर्नी बॉट पर जाप किया, जहां मैंने उपयोगकर्ता साइकेडेलिक के कुछ हद तक सर्वनाश के बाद की दिल्ली की प्रस्तुति देखी।

पहले डिस्को डिफ्यूजन और क्रेयॉन जैसे एआई बॉट्स के साथ काम करने के बाद, मिडजर्नी की खोज का एक दिलचस्प पहलू यह देख रहा था कि अलग-अलग एआई एक ही टेक्स्ट पर कैसे प्रतिक्रिया देंगे। नीचे दिए गए चित्र उसी संकेत के साथ उत्पन्न परिणाम दिखाते हैं, ‘मानसून की बारिश के दौरान शहर’, मिडजॉर्नी द्वारा, डिस्को डिफ्यूजन, Google Colab द्वारा होस्ट किया जाने वाला एक फ्री-टू-यूज़ AI टूल, और क्रेयॉन, जिसे पहले DALL-E मिनी के नाम से जाना जाता था।

मानसून की बारिश के दौरान एक शहर (क्रेडिट: क्रेयॉन) मानसून की बारिश के दौरान एक शहर (क्रेडिट: डिस्को डिफ्यूजन) मानसून की बारिश के दौरान एक शहर (क्रेडिट: मिडजर्नी)

जबकि क्रेयॉन अपेक्षाकृत यथार्थवादी छवियों को फेंकता है, डिस्को डिफ्यूजन असली, प्रभावशाली परिणाम दिखाता है, और मिडजर्नी दोनों के बीच में कुछ हद तक बैठता है।

होल्ज़ के अनुसार, मध्य यात्रा को “चंचल, कल्पनाशील सैंडबॉक्स” के रूप में समझा जा सकता है। “लक्ष्य हर किसी को उस सैंडबॉक्स तक पहुंच प्रदान करना है, ताकि हर कोई समझ सके कि क्या संभव है और हम एक सभ्यता के रूप में कहां हैं। हम क्या कर सकते हैं? भविष्य के लिए इसका क्या मतलब है?”

होल्ज़ ने इस आशंका को खारिज कर दिया कि एआई यहां मनुष्यों या उनकी नौकरियों को “प्रतिस्थापित” करने के लिए है। “जब कंप्यूटर ग्राफिक्स का आविष्कार किया गया था, तो इसी तरह के सवाल थे – क्या यह कलाकारों की जगह लेगा? और यह नहीं है। कुछ भी हो, कंप्यूटर ग्राफिक्स कलाकारों को अधिक शक्तिशाली बनाता है, ”वे कहते हैं।

होल्ज़ कहते हैं, “जब भी हम कुछ नया देखते हैं, तो यह पता लगाने की कोशिश की जाती है कि क्या यह खतरनाक है और हम इसे बाघ की तरह मानते हैं। एआई बाघ नहीं है। यह वास्तव में पानी की एक बड़ी नदी की तरह है। एक बाघ पानी से बहुत अलग तरीके से खतरनाक होता है। पानी एक ऐसी चीज है जिसके लिए आप एक नाव बना सकते हैं, आप तैरना सीख सकते हैं, या आप बिजली बनाने वाले बांध बना सकते हैं। यह हमें खाने की कोशिश नहीं कर रहा है, यह हम पर गुस्सा नहीं है। इसमें कोई भावना या भावना या विचार नहीं है। यह एक शक्तिशाली शक्ति की तरह है। यह एक अवसर है।”