Open AI-მ გაწვრთნა AI ნერვული ქსელი, რომ ეთამაშა Minecraft წინასწარი ვიდეო ტრენინგის (VPT) გამოყენებით ადამიანის ულევი ვიდეო მონაცემების უზარმაზარ მასივზე, რომელიც თამაშობს Minecraft-ს, ხოლო იყენებდა მხოლოდ მცირე რაოდენობის მარკირებული კონტრაქტორის მონაცემებს.

მცირე შესწორებით, ხელოვნური ინტელექტის კვლევისა და განხორციელების კომპანია დარწმუნებულია, რომ მის მოდელს შეუძლია ისწავლოს ალმასის ხელსაწყოების შექმნა, ამოცანა, რომელიც ჩვეულებრივ ატარებს გამოცდილ ადამიანებს 20 წუთზე მეტ ხანს (24 ნაბიჯი). მოდელი იყენებს კლავიშებისა და მაუსის მოძრაობების ადამიანურ ინტერფეისს, რაც მას საკმაოდ ზოგადს ხდის და გადადგმული ნაბიჯია აგენტების შექმნისკენ, რომლებიც იყენებენ კომპიუტერებს.

Microsoft-ის მხარდაჭერილი ფირმის სპიკერმა თქვა: „ინტერნეტი შეიცავს უამრავ საჯაროდ ხელმისაწვდომი ვიდეოს, საიდანაც შეგვიძლია ვისწავლოთ. შეგიძლიათ უყუროთ, როგორ აკეთებს ადამიანს შესანიშნავი პრეზენტაცია, ციფრული მხატვარი ხატავს მშვენიერ მზის ჩასვლას ან Minecraft-ის მოთამაშეს, როგორ აშენებს რთულ სახლს. თუმცა, ეს ვიდეოები იძლევა მხოლოდ მომხდარის ჩანაწერს, მაგრამ არა ზუსტ აღწერას, თუ როგორ მიაღწიეს მას, რაც იმას ნიშნავს, რომ თქვენ არ გეცოდინებათ მაუსის მოძრაობებისა და კლავიშების დაჭერის ზუსტი თანმიმდევრობა.

„თუ ჩვენ გვინდა ავაშენოთ ფართომასშტაბიანი ფონდის მოდელები ამ დომენებში, როგორც ეს გავაკეთეთ ენაზე GPT-ით, მაშინ ქმედების ლეიბლების ნაკლებობა ქმნის ახალ პრობლემას, რომელიც არ არსებობს ენის დომენში, სადაც „მოქმედების ეტიკეტები“ უბრალოდ არის. შემდეგი სიტყვები წინადადებაში."

იმისათვის, რომ ისარგებლოს ინტერნეტში არსებული არალეიბლირებული ვიდეო მონაცემების სიმდიდრით, Open AI წარმოგიდგენთ ახალ, მაგრამ მარტივ, ნახევრად ზედამხედველობით სიმულაციური ტრენინგის მეთოდს: წინასწარი ვიდეო ტრენინგი (VPT). გუნდი იწყებს კონტრაქტორებისგან მცირე მონაცემთა ნაკრების შეგროვებით, სადაც ჩაწერს არა მხოლოდ მათ ვიდეოებს, არამედ მათ მოქმედებებს, რომლებიც ამ შემთხვევაში არის კლავიშების დაჭერა და მაუსის მოძრაობა. ამ მონაცემებით, კომპანიას შეუძლია მოამზადოს ინვერსიული დინამიკის მოდელი (IDM), რომელიც პროგნოზირებს ვიდეოს თითოეულ ეტაპზე განხორციელებულ ქმედებებს. მნიშვნელოვანია აღინიშნოს, რომ IDM-ს შეუძლია გამოიყენოს წარსული და მომავალი ინფორმაცია მოქმედების გამოსაცნობად ყოველ ნაბიჯზე.

სპიკერმა დასძინა: ”ეს ამოცანა ბევრად უფრო მარტივია და მოითხოვს გაცილებით ნაკლებ მონაცემებს, ვიდრე ქცევის კლონირების ამოცანა, რომელიც მოიცავს მოქმედებების წინასწარმეტყველებას მხოლოდ წარსული ვიდეოს კადრებიდან, რაც მოითხოვს დასკვნას, რისი გაკეთება სურს ადამიანს და როგორ გააკეთოს ეს. შემდეგ ჩვენ შეგვიძლია გამოვიყენოთ გაწვრთნილი IDM უფრო დიდი ონლაინ ვიდეო მონაცემთა ნაკრების მარკირებისთვის და ვისწავლოთ მასზე მოქმედება ქცევითი კლონირების გზით.

Open AI-ის თანახმად, VPT გზას უხსნის აგენტებს, რომ ისწავლონ როგორ იმოქმედონ ინტერნეტში დიდი რაოდენობით ვიდეოების ყურებით.

კომპანიის სპიკერმა თქვა: ”გენერაციულ ვიდეო მოდელირებასთან ან კონტრასტული მეთოდებთან შედარებით, რომლებიც მხოლოდ წარმომადგენლობით განსჯას აწარმოებენ, VPT გთავაზობთ საინტერესო შესაძლებლობას პირდაპირ ასწავლოთ ფართომასშტაბიანი ქცევითი განსჯა უფრო მეტ დომენში, ვიდრე უბრალოდ ენა. მიუხედავად იმისა, რომ ჩვენ ჩავატარეთ მხოლოდ AI ექსპერიმენტები Minecraft-ში, თამაში ძალიან ღიაა და ადამიანის მშობლიური ინტერფეისი (მაუსი და კლავიატურა) ძალიან ზოგადია, ამიტომ გვჯერა, რომ ჩვენი შედეგები კარგად ითარგმნება სხვა მსგავს დომენებზე, როგორიცაა კომპიუტერის გამოყენება.


რეკომენდებული: Gran Turismo 7-ის ახალი AI მზადაა თამაშის საუკეთესო მოთამაშეების დასაძლევად

გაზიარება:

სხვა სიახლეები