Açıq süni intellekt, Minecraft oynayan bir insanın etiketsiz video məlumatlarının böyük bir sırası üzərində videoqabağı təlimdən (VPT) istifadə edərək Minecraft oynatmaq üçün süni intellekt neyron şəbəkəsini öyrətdi, eyni zamanda yalnız az miqdarda etiketli podratçı məlumatlarından istifadə etdi.

Bir az düzəlişlə, AI tədqiqat və tətbiqi şirkəti əmindir ki, onun modeli almaz alətlər yaratmağı öyrənə bilər, bu, adətən təcrübəli insanlar üçün 20 dəqiqədən (24 addım) çox vaxt aparır. Model, klaviatura və siçan hərəkətlərinin yerli insan interfeysindən istifadə edir, bu onu olduqca ümumi edir və kompüterlərdən istifadə edən agentlərin yaradılması istiqamətində bir addımdır.

Microsoft tərəfindən dəstəklənən firmanın sözçüsü dedi: “İnternetdə öyrənə biləcəyimiz çoxlu açıq videolar var. Bir insanın əla təqdimat etdiyini, rəqəmsal rəssamın gözəl gün batımını çəkdiyini və ya Minecraft oyunçusunun mürəkkəb bir ev tikdiyini seyr edə bilərsiniz. Bununla belə, bu videolar yalnız baş verənlərin qeydini təqdim edir, lakin buna necə nail olunduğunun dəqiq təsviri deyil, yəni siçan hərəkətlərinin və düymələrin vuruşlarının dəqiq ardıcıllığını bilməyəcəksiniz.

"Əgər biz GPT ilə dildə etdiyimiz kimi, bu domenlərdə geniş miqyaslı təməl modellər qurmaq istəyiriksə, onda fəaliyyət etiketlərinin olmaması dil sahəsində mövcud olmayan yeni bir problem yaradır, burada" fəaliyyət etiketləri" sadəcə olaraq cümlədəki növbəti sözlər”.

İnternetdə mövcud olan etiketsiz video məlumatların zənginliyindən istifadə etmək üçün Open AI yeni, lakin sadə, yarı nəzarət edilən simulyasiya təlimi metodunu təqdim edir: Videodan əvvəl Təlim (VPT). Komanda podratçılardan kiçik bir məlumat toplusu toplamaqla başlayır, burada o, təkcə onların videolarını deyil, həm də bu halda düymələrin və siçan hərəkətləri olan hərəkətlərini qeyd edir. Bu məlumatlarla şirkət videonun hər mərhələsində görülən hərəkətləri proqnozlaşdıran Tərs Dinamik Modeli (IDM) öyrədə bilər. Qeyd etmək vacibdir ki, IDM hər addımda hərəkəti təxmin etmək üçün keçmiş və gələcək məlumatlardan istifadə edə bilər.

Sözçü əlavə etdi: “Bu tapşırıq davranışın klonlaşdırılması tapşırığından daha sadədir və daha az məlumat tələb edir, bu, yalnız keçmiş video kadrlarından hərəkətlərin proqnozlaşdırılmasını nəzərdə tutur, bu da insanın nə etmək istədiyini və bunu necə edəcəyini çıxarmağı tələb edir. Daha sonra biz təlim keçmiş IDM-dən daha böyük onlayn video verilənlər bazasını etiketləmək üçün istifadə edə bilərik və davranış klonlaması vasitəsilə bu barədə hərəkət etməyi öyrənə bilərik.”

Open AI-a görə, VPT agentlərin onlayn olaraq çoxlu sayda videoya baxaraq necə davranacağını öyrənmələrinə yol açır.

Bir şirkət sözçüsü dedi: “Yalnız təmsilçi mühakimələr yaradan generativ video modelləşdirmə və ya təzadlı üsullarla müqayisədə VPT geniş miqyaslı davranış mühakimələrini sadəcə dildən daha çox sahədə birbaşa öyrətmək üçün maraqlı fürsət təqdim edir. Yalnız Minecraft-da süni intellektlə təcrübələr aparsaq da, oyun çox açıqdır və yerli insan interfeysi (siçan və klaviatura) çox ümumidir, buna görə də nəticələrimizin kompüter istifadəsi kimi digər oxşar domenlərə yaxşı tərcümə olunduğuna inanırıq.”


Tövsiyə: Gran Turismo 7-nin yeni AI oyunun ən yaxşı oyunçularını qəbul etməyə hazırdır

Paylaş:

Digər xəbərlər