Open AI ने एक AI न्यूरल नेटवर्क को प्री-वीडियो ट्रेनिंग (VPT) का उपयोग करके Minecraft खेलने के लिए प्रशिक्षित किया है, जो कि केवल एक छोटी मात्रा में लेबल किए गए ठेकेदार डेटा का उपयोग करते हुए मानव के गैर-लेबल वाले वीडियो डेटा की एक विशाल सरणी पर है।

थोड़े से फेरबदल के साथ, AI R&D कंपनी को भरोसा है कि उसका मॉडल हीरा उपकरण बनाना सीख सकता है, एक ऐसा कार्य जिसमें आमतौर पर अनुभवी लोगों के लिए 20 मिनट (24 क्रियाएं) से अधिक समय लगता है। मॉडल कीस्ट्रोक्स और माउस आंदोलनों के एक मूल मानव इंटरफ़ेस का उपयोग करता है, जिससे यह कंप्यूटर का उपयोग करने वाले एजेंटों को बनाने की दिशा में एक कदम बनने के लिए पर्याप्त सामान्य हो जाता है।

Microsoft समर्थित फर्म के एक प्रवक्ता ने कहा: "इंटरनेट में भारी मात्रा में सार्वजनिक वीडियो हैं जिनसे हम सीख सकते हैं। आप एक व्यक्ति को एक शानदार प्रस्तुति देते हुए देख सकते हैं, एक डिजिटल कलाकार एक सुंदर सूर्यास्त पेंट कर सकता है, एक Minecraft खिलाड़ी एक जटिल घर बना सकता है। हालांकि, ये वीडियो केवल क्या हुआ इसका एक रिकॉर्ड प्रदान करते हैं, यह कैसे हासिल किया गया इसका सटीक विवरण नहीं है, जिसका अर्थ है कि आप माउस आंदोलनों और कीस्ट्रोक के सटीक अनुक्रम को नहीं पहचान पाएंगे।

"अगर हम इन क्षेत्रों में बड़े पैमाने पर नींव मॉडल बनाना चाहते हैं, जैसा कि हमने जीपीटी के साथ भाषा में किया था, तो एक्शन लेबल्स की कमी एक नई समस्या पैदा करती है जो भाषा डोमेन में मौजूद नहीं है, जहां" एक्शन लेबल्स "सिर्फ एक वाक्य में अगले शब्द।

वेब पर उपलब्ध बिना लेबल वाले वीडियो डेटा के धन का लाभ उठाने के लिए, ओपन एआई एक नई, फिर भी सरल, अर्ध-पर्यवेक्षित सिमुलेशन प्रशिक्षण पद्धति पेश करता है: प्री-वीडियो ट्रेनिंग (वीपीटी)। टीम ठेकेदारों से एक छोटा डेटासेट इकट्ठा करके शुरू करती है, जहां यह न केवल उनके वीडियो रिकॉर्ड करती है, बल्कि उनके कार्यों को भी रिकॉर्ड करती है, जो इस मामले में कीस्ट्रोक और माउस मूवमेंट हैं। इस डेटा के साथ, एक कंपनी एक व्युत्क्रम डायनेमिक्स मॉडल (IDM) को प्रशिक्षित कर सकती है जो वीडियो के प्रत्येक चरण में की गई कार्रवाई की भविष्यवाणी करता है। यह नोट करना महत्वपूर्ण है कि IDM प्रत्येक चरण पर कार्रवाई का अनुमान लगाने के लिए अतीत और भविष्य की जानकारी का उपयोग कर सकता है।

प्रतिनिधि ने आगे कहा: "यह कार्य बहुत आसान है और व्यवहार क्लोनिंग कार्य की तुलना में बहुत कम डेटा की आवश्यकता होती है, जो केवल वीडियो के पिछले फ्रेम से क्रियाओं की भविष्यवाणी करना है, जिसके लिए व्यक्ति क्या करना चाहता है और कैसे करना है, इसके बारे में अनुमान लगाने की आवश्यकता है। इसके बाद हम एक बहुत बड़े ऑनलाइन वीडियो डेटासेट को लेबल करने के लिए प्रशिक्षित IDM का उपयोग कर सकते हैं और व्यवहारिक क्लोनिंग के साथ कार्य करना सीख सकते हैं।

ओपन एआई के अनुसार, वीपीटी बड़ी मात्रा में ऑनलाइन वीडियो देखकर एजेंटों के लिए यह सीखने का मार्ग प्रशस्त कर रहा है कि कैसे कार्य करना है।

कंपनी के एक प्रवक्ता ने कहा: "जनरेटिव वीडियो मॉडलिंग या कंट्रास्ट विधियों की तुलना में जो केवल प्रतिनिधि निर्णय उत्पन्न करते हैं, वीपीटी केवल भाषा की तुलना में अधिक क्षेत्रों में सीधे बड़े पैमाने पर व्यवहारिक निर्णय सिखाने का एक रोमांचक अवसर प्रदान करता है। हालाँकि हमने Minecraft में केवल AI प्रयोग किए हैं, खेल बहुत खुला है और मूल मानव इंटरफ़ेस (माउस और कीबोर्ड) बहुत सामान्य है, इसलिए हमें लगता है कि हमारे परिणाम कंप्यूटर उपयोग जैसे अन्य समान क्षेत्रों के अनुकूल हैं।


अनुशंसित: Gran Turismo 7 का नया AI गेम के सर्वश्रेष्ठ खिलाड़ियों को टक्कर देने के लिए तैयार है

शेयर:

अन्य समाचार