Open AI אימן רשת עצבית בינה מלאכותית לשחק Minecraft באמצעות אימון קדם וידאו (VPT) על מגוון עצום של נתוני וידאו ללא תווית של אדם שמשחק Minecraft, תוך שימוש רק בכמות קטנה של נתוני קבלן מסומנים.

עם קצת כוונון, חברת מו"פ בינה מלאכותית בטוחה שהמודל שלה יכול ללמוד ליצור כלי יהלום, משימה שנמשכת בדרך כלל יותר מ-20 דקות (24 פעולות) עבור אנשים מנוסים. המודל משתמש בממשק אנושי מקורי של הקשות ותנועות עכבר, מה שהופך אותו לגנרי מספיק כדי להיות צעד לקראת יצירת סוכנים המשתמשים במחשבים.

דובר של החברה הנתמכת על ידי מיקרוסופט אמר: "לאינטרנט יש כמות עצומה של וידאו ציבורי שאנחנו יכולים ללמוד מהם. אתה יכול לראות אדם עושה מצגת נהדרת, אמן דיגיטלי מצייר שקיעה יפה, שחקן Minecraft בונה בית מורכב. עם זאת, סרטונים אלה מספקים רק תיעוד של מה שקרה, לא תיאור מדויק של איך זה הושג, כלומר לא תזהה את הרצף המדויק של תנועות העכבר והקשות.

"אם אנחנו רוצים לבנות מודלים של יסודות בקנה מידה גדול בתחומים האלה, כפי שעשינו בשפה עם GPT, אז היעדר תוויות פעולה יוצר בעיה חדשה שלא קיימת בתחום השפה, שם "תוויות פעולה" הן רק המילים הבאות במשפט."

על מנת לנצל את השפע של נתוני וידאו ללא תווית הזמינים באינטרנט, Open AI מציגה שיטת אימון סימולציה חדשה, אך פשוטה, מפוקחת למחצה: Pre-Video Training (VPT). הצוות מתחיל באיסוף מערך נתונים קטן מקבלנים, שבו הוא מתעד לא רק את הסרטונים שלהם, אלא גם את הפעולות שלהם, שבמקרה זה הן הקשות ותנועות עכבר. עם הנתונים האלה, חברה יכולה להכשיר מודל דינמיקה הפוך (IDM) שמנבא את הפעולה שננקטה בכל שלב של הסרטון. חשוב לציין ש-IDM יכול להשתמש במידע עבר ועתיד כדי לנחש את הפעולה בכל שלב.

הנציג הוסיף: "המשימה הזו הרבה יותר פשוטה ודורשת הרבה פחות נתונים ממשימת שיבוט ההתנהגות, שהיא לחזות פעולות רק מפריימים קודמים של סרטון, מה שמצריך הסקה לגבי מה האדם רוצה לעשות ואיך לעשות זאת. לאחר מכן נוכל להשתמש ב-IDM המיומן כדי לתייג מערך וידאו מקוון גדול בהרבה וללמוד כיצד לפעול עם שיבוט התנהגותי."

לפי Open AI, ה-VPT סולל את הדרך לסוכנים ללמוד כיצד לפעול על ידי צפייה בכמויות עצומות של סרטונים באינטרנט.

דובר החברה אמר: "בהשוואה לשיטות מודלים של וידאו או ניגודיות המייצרות רק שיפוטים מייצגים, VPT מציעה הזדמנות מרגשת ללמד ישירות שיפוטים התנהגותיים בקנה מידה גדול ביותר תחומים מאשר רק שפה. למרות שעשינו רק ניסויי בינה מלאכותית במיינקראפט, המשחק מאוד פתוח והממשק האנושי המקורי (עכבר ומקלדת) הוא גנרי מאוד, אז אנחנו חושבים שהתוצאות שלנו מתאימות היטב לתחומים דומים אחרים, כמו שימוש במחשב."


מומלץ: ה-AI החדש של Gran Turismo 7 מוכן להתמודד עם השחקנים הטובים ביותר של המשחק

שתף זאת:

חדשות אחרות