Openai का दावा है कि बेहतर GPT-4O मॉडल उपभोक्ताओं और व्यवसायों दोनों को अधिक यथार्थवादी छवियों, पाठ के सुसंगत पैराग्राफ, वाणिज्यिक लोगो और पावरपॉइंट प्रस्तुतियों को अधिक आसानी से उत्पन्न करने में सक्षम बनाता है
और पढ़ें
Openai ने अपने AI सिस्टम, GPT-4O का एक बढ़ाया संस्करण जारी किया है, जो अधिक यथार्थवादी तस्वीरें बनाने में सक्षम है। अपग्रेड मानव प्रशिक्षकों के साथ एक साल के सहयोग का परिणाम है।
GPT-4O ने Dall-E 3 को डिफ़ॉल्ट छवि जनरेशन मॉडल के रूप में बदल दिया है, जो Openai के Chatgpt Chatbot को पावरिंग करता है, और CHATGPT मुक्त, प्लस, टीम और प्रो के उपयोगकर्ता अब कंपनी के अनुसार इसे एक्सेस कर सकते हैं।
उस समय OpenAI के सबसे उन्नत AI मॉडल के अधिक किफायती संस्करण के रूप में बिल, GPT-4O को पहली बार पिछले साल एक मल्टीमॉडल सिस्टम के रूप में लॉन्च किया गया था, जो पाठ, वीडियो, ऑडियो और छवियों का निर्माण और विश्लेषण करने में सक्षम था।
Openai का दावा है कि बेहतर GPT-4O मॉडल उपभोक्ताओं और व्यवसायों दोनों को अधिक यथार्थवादी छवियों, पाठ के सुसंगत पैराग्राफ, वाणिज्यिक लोगो और पावरपॉइंट प्रस्तुतियों को अधिक आसानी से उत्पन्न करने में सक्षम बनाता है।
परियोजना के प्रमुख शोधकर्ता गेब्रियल गोह के अनुसार, GPT-4O में प्रगति को मानव प्रशिक्षकों की एक टीम द्वारा संभव बनाया गया था, जिन्होंने प्रशिक्षण डेटा एनोटेट किया था, जैसे कि टाइपोस, गलत हाथों और विकृत चेहरों जैसे एआई-जनित त्रुटियों की पहचान करना।
यह दृष्टिकोण, जिसे “मानव प्रतिक्रिया से सुदृढीकरण सीखने” (RLHF) के रूप में जाना जाता है, प्रारंभिक प्रशिक्षण के बाद अपने मॉडल को परिष्कृत करने के लिए AI कंपनियों द्वारा एक व्यापक रूप से उपयोग की जाने वाली तकनीक है। गोह ने कहा कि इस पद्धति ने जीपीटी -4 ओ को मानव निर्देशों का अधिक सटीक रूप से पालन करने की अनुमति दी, जिससे ऐसे दृश्य पैदा होते हैं जो अधिक उपयोगी और अधिक सटीक हैं।
Openai के AI सिस्टम के पैमाने को देखते हुए, इन मानव प्रशिक्षकों का प्रभाव महत्वपूर्ण है। कंपनी की रिपोर्ट है कि CHATGPT के 400 मिलियन से अधिक साप्ताहिक उपयोगकर्ता हैं। Openai का कहना है कि GPT-4O के लिए RLHF प्रक्रिया पर लगभग 100 मानव श्रमिकों ने सहयोग किया।
इस शोध के परिणामस्वरूप, Openai बताता है कि CHATGPT की छवि पीढ़ी क्षमताएं अब व्यक्तिगत उपयोगकर्ताओं और व्यवसायों दोनों के लिए अधिक फायदेमंद हैं। उदाहरण के लिए, GPT-4O अब छवियों के साथ-साथ समझने योग्य पाठ के पैराग्राफ को उत्पन्न कर सकता है-ओपनईआई के मॉडल के पहले पुनरावृत्तियों को प्राप्त करने के लिए संघर्ष किया।
हालांकि, एआई छवि जनरेटर विवादास्पद बने हुए हैं। कुछ कलाकारों का तर्क है कि ये उपकरण अपने मूल काम के तत्वों की नकल करके अपनी आजीविका को खतरे में डालते हैं।
Openai का कहना है कि GPT-4O को शटरस्टॉक और “सार्वजनिक रूप से उपलब्ध डेटा” जैसी कंपनियों के साथ अपने सहयोग से दोनों गोपनीय डेटा का उपयोग करके प्रशिक्षित किया गया था।