Open AI, bir AI sinir ağını Minecraft oynamak için, Minecraft oynayan bir insanın çok sayıda etiketlenmemiş video verisi üzerinde video öncesi eğitimi (VPT) kullanarak ve yalnızca az miktarda etiketlenmiş yüklenici verisi kullanarak eğitti.

AI Ar-Ge şirketi, biraz ince ayar yaparak, modelinin deneyimli insanlar için genellikle 20 dakikadan fazla (24 eylem) süren bir görev olan elmas aletler oluşturmayı öğrenebileceğinden emin. Model, tuş vuruşları ve fare hareketlerinden oluşan doğal bir insan arabirimi kullanır ve bu, onu bilgisayar kullanan aracılar oluşturmaya yönelik bir adım olacak kadar genel hale getirir.

Microsoft destekli şirketin bir sözcüsü şunları söyledi: "İnternet, öğrenebileceğimiz çok miktarda halka açık video içeriyor. Bir kişinin harika bir sunum yapmasını, bir dijital sanatçının güzel bir gün batımını çizmesini, bir Minecraft oyuncusunun karmaşık bir ev inşa etmesini izleyebilirsiniz. Ancak, bu videolar yalnızca ne olduğunun bir kaydını sağlar, bunun nasıl başarıldığına dair tam bir açıklama sağlamaz; bu, fare hareketlerinin ve tuş vuruşlarının tam sırasını tanımayacağınız anlamına gelir.

"GPT ile dilde yaptığımız gibi, bu alanlarda büyük ölçekli temel modeller oluşturmak istiyorsak, eylem etiketlerinin olmaması, "eylem etiketlerinin" yalnızca olduğu dil alanında var olmayan yeni bir sorun yaratır. bir cümledeki sonraki kelimeler.”

Web'de bulunan etiketlenmemiş video verilerinin zenginliğinden yararlanmak için Open AI, yeni, ancak basit, yarı denetimli bir simülasyon eğitim yöntemi sunuyor: Video Öncesi Eğitim (VPT). Ekip, yüklenicilerden küçük bir veri kümesi toplayarak işe başlar ve burada yalnızca videolarını değil, aynı zamanda bu durumda tuş vuruşları ve fare hareketleri olan eylemlerini de kaydeder. Bu verilerle bir şirket, videonun her aşamasında gerçekleştirilen eylemi tahmin eden bir Ters Dinamik Modeli (IDM) eğitebilir. IDM'nin her adımda eylemi tahmin etmek için geçmiş ve gelecekteki bilgileri kullanabileceğine dikkat etmek önemlidir.

Temsilci şunları ekledi: "Bu görev, kişinin ne yapmak istediği ve bunu nasıl yapacağı hakkında çıkarım gerektiren bir videonun yalnızca geçmiş karelerinden eylemleri tahmin etmeye yönelik davranış klonlama görevinden çok daha basit ve çok daha az veri gerektiriyor. Daha sonra eğitimli IDM'yi çok daha büyük bir çevrimiçi video veri setini etiketlemek ve davranışsal klonlama ile nasıl davranacağımızı öğrenmek için kullanabiliriz."

Open AI'a göre VPT, temsilcilerin çevrimiçi olarak çok miktarda video izleyerek nasıl hareket edeceklerini öğrenmelerinin yolunu açıyor.

Şirketin bir sözcüsü şunları söyledi: "Yalnızca temsili yargılar üreten üretken video modelleme veya kontrast yöntemleriyle karşılaştırıldığında, VPT, yalnızca dilden daha fazla alanda büyük ölçekli davranışsal yargıları doğrudan öğretmek için heyecan verici bir fırsat sunuyor. Minecraft'ta yalnızca AI deneyleri yapmış olmamıza rağmen, oyun çok açık ve yerel insan arayüzü (fare ve klavye) çok genel, bu nedenle sonuçlarımızın bilgisayar kullanımı gibi diğer benzer alanlar için çok uygun olduğunu düşünüyoruz."


Tavsiye: Gran Turismo 7'nin yeni yapay zekası, oyunun en iyi oyuncularıyla karşılaşmaya hazır

Paylaş:

Diğer haberler