टेक दिग्गज ने मल्टीमॉडल मॉडल- स्काउट, मावेरिक, और बीहमोथ की एक तिकड़ी लॉन्च की है।
और पढ़ें
मेटा ने लामा परिवार में आर्टिफिशियल इंटेलिजेंस मॉडल की अपनी नवीनतम पीढ़ी का अनावरण किया है, शनिवार (5 अप्रैल) की घोषणा में सप्ताहांत में तीन नए मॉडल जारी किए हैं। Llama 4 Suite- स्काउट, Maverick, और Behemoth- ओपन एआई के भविष्य को आकार देने के लिए कंपनी की महत्वाकांक्षा में एक महत्वपूर्ण छलांग को चिह्नित करता है, जिसमें टेक्स्ट, छवियों और वीडियो में उन्नत तर्क से लेकर उन्नत तर्क तक सब कुछ से निपटने के लिए डिज़ाइन किए गए मॉडल हैं।
मॉडल एक नए “विशेषज्ञों के मिश्रण” (एमओई) वास्तुकला पर बनाए गए हैं, जो मॉडल के भीतर विशेष घटकों को कार्यों को सौंपकर अधिक दक्षता का वादा करता है। मेटा का दावा है कि मावेरिक, इसके प्रमुख सामान्य-उद्देश्य सहायक, ओपनईएआई के जीपीटी -4 ओ और Google के मिथुन 2.0 को कोडिंग, तर्क और छवि-आधारित बेंचमार्क पर कई तरह से बेहतर बना सकते हैं। हालाँकि, यह Openai के सबसे उन्नत GPT-4.5 और Google के नए मिथुन 2.5 प्रो से कम हो जाता है,
टेकक्रंच सूचना दी।
स्काउट और मावरिक अब मेटा की वेबसाइट पर और एआई प्लेटफॉर्म हगिंग फेस सहित भागीदारों के माध्यम से स्वतंत्र रूप से उपलब्ध हैं, हालांकि उनका उपयोग उल्लेखनीय कैवेट्स के साथ आता है। सबसे महत्वपूर्ण बात यह है कि मेटा यूरोपीय संघ में स्थित कंपनियों और डेवलपर्स को मॉडल का उपयोग करने या वितरित करने से रोक रहा है – क्षेत्र के कड़े एआई शासन और डेटा गोपनीयता कानूनों द्वारा संचालित एक कदम की संभावना है। मेटा ने पहले यूरोपीय संघ के नियामक ढांचे की भारी-भरकम और नवाचार-स्टिफलिंग के रूप में आलोचना की है।
खुली दौड़ गर्म हो जाती है
यह रिलीज ओपन-सोर्स एआई दुनिया में गतिविधि की एक हड़बड़ी का अनुसरण करता है, जो चीनी लैब डीपसेक की रैपिड चढ़ाई के हिस्से में है। इसके मॉडल-विशेष रूप से आर 1 और वी 3-ने लामा 2 के खिलाफ प्रतिस्पर्धी रूप से प्रदर्शन किया है, मेटा को लामा 4 के विकास में तेजी लाने के लिए प्रेरित किया, कथित तौर पर आंतरिक “युद्ध कक्ष” को रिवर्स-इंजीनियर डीपसेक की दक्षता लाभ के लिए लॉन्च किया।
तीन नए मॉडलों में से, स्काउट सबसे हल्का है, जिसमें 17 बिलियन सक्रिय पैरामीटर और एक प्रभावशाली 10 मिलियन-टोकन संदर्भ विंडो है। यह इसे विशाल दस्तावेजों और लंबे कोडबेस को संसाधित करने की क्षमता देता है, जिससे यह शैक्षणिक अनुसंधान, उद्यम डेटा विश्लेषण और कानूनी कार्य के लिए उपयुक्त हो जाता है। यह एक एकल NVIDIA H100 GPU पर चलने के लिए भी अनुकूलित है, जिससे इसके भारी भाई -बहन की तुलना में अधिक मामूली तैनाती की अनुमति मिलती है।
मावरिक, इस बीच, 400 बिलियन मापदंडों (128 विशेषज्ञों में 17 बिलियन सक्रिय) के साथ वजन होता है और इसे रचनात्मक लेखन और भाषा समझ जैसे अधिक सामान्य एआई सहायक कार्यों की ओर ले जाता है। इसे प्रभावी ढंग से संचालित करने के लिए एनवीडिया के डीजीएक्स सिस्टम सहित एंटरप्राइज़-लेवल कंप्यूट इन्फ्रास्ट्रक्चर की आवश्यकता होती है।
अभी भी प्रशिक्षण में, एक मॉडल है, एक मॉडल जो मेटा कहता है कि प्रमुख स्टेम बेंचमार्क पर प्रतिद्वंद्वियों को ग्रहण करेगा। 288 बिलियन सक्रिय मापदंडों और कुल मिलाकर लगभग दो ट्रिलियन के साथ, यह सार्वजनिक रूप से वर्णित सबसे बड़े एआई मॉडल में से एक है। मेटा के शुरुआती परीक्षणों से पता चलता है कि Behemoth जटिल गणितीय और वैज्ञानिक समस्याओं को हल करने में GPT-4.5, क्लाउड 3.7 सॉनेट, और मिथुन 2.0 प्रो को हरा सकता है-हालांकि मिथुन 2.5 प्रो कई मोर्चों पर आगे रहता है।