#İnnovativ texnologiyalar #Xəbərlər

DeepMind genişlənən dünya modelində müxtəlif tapşırıqları yerinə yetirməyi öyrənən AI agentini təqdim edir

Ingrid Fadelli , Phys.org

Sadie Harley tərəfindən redaktə edilmiş , Robert Eqan tərəfindən nəzərdən keçirilmişdir

 Redaktorların qeydləriDreamer 4 öz dünya modelinin daxilində öyrənməni gücləndirməklə mürəkkəb nəzarət tapşırıqlarını həll etməyi öyrənir. Vizuallaşdırma üçün təsəvvür edilən təlim ardıcıllığını deşifrə edirik, dünya modelinin aşağı səviyyəli siçan və klaviatura hərəkətlərindən, o cümlədən blokları sındırmaq, alətlərdən istifadə etmək və crafting cədvəlləri ilə qarşılıqlı əlaqə yaratmaqdan geniş spektrli oyun mexanikasını simulyasiya etməyi öyrəndiyini göstəririk. Kredit: arXiv (2025). DOI: 10.48550/arxiv.2509.24527

Son onillikdə dərin öyrənmə süni intellekt (AI) agentlərinin rəqəmsal mühitlərdə necə qavradığını və fəaliyyət göstərdiyini dəyişərək onlara stolüstü oyunlara yiyələnməyə, simulyasiya edilmiş robotları idarə etməyə və müxtəlif digər tapşırıqları etibarlı şəkildə həll etməyə imkan verir. Bununla belə, bu sistemlərin əksəriyyəti hələ də təvazökar bacarıqlara nail olmaq üçün böyük həcmdə birbaşa təcrübədən – milyonlarla sınaq və səhv qarşılıqlı əlaqədən asılıdır.

Bu kobud güc yanaşması onların fiziki dünyada faydalılığını məhdudlaşdırır, burada belə təcrübələr yavaş, bahalı və ya təhlükəlidir.

Bu məhdudiyyətləri aradan qaldırmaq üçün tədqiqatçılar dünya modellərinə – agentlərin təhlükəsiz şəkildə məşq edə və öyrənə biləcəyi simulyasiya edilmiş mühitlərə müraciət etdilər.

Bu dünya modelləri təkcə dünyanın vizual görünüşlərini deyil, həm də əsas dinamikanı tutmaq məqsədi daşıyır: obyektlərin necə hərəkət etdiyini, toqquşduğunu və hərəkətlərə necə reaksiya verdiyini. Bununla belə, Atari və Go kimi sadə oyunlar effektiv sınaq meydançaları kimi xidmət etsə də, Minecraft və ya robototexnika mühitləri kimi mürəkkəb dünyaların zəngin, açıq uçlu fizikasını təmsil etməyə gəldikdə dünya modelləri hələ də zəifləyir.

Google DeepMind-in tədqiqatçıları bu yaxınlarda qabaqcadan qeydə alınmış videoların məhdud dəstini nəzərə alaraq, bütünlüklə genişlənə bilən dünya modeli çərçivəsində mürəkkəb davranışları öyrənməyə qadir olan yeni süni agent Dreamer 4-ü inkişaf etdirdilər.

ArXiv preprint serverində dərc olunan məqalədə təqdim olunan yeni model , Minecraft-da heç bir təcrübə etmədən brilyant əldə edən ilk süni intellekt (AI) agenti idi. Bu əlamətdar nailiyyət, Dreamer 4-dən uğurlu süni intellekt agentlərini sırf təxəyyüldə öyrətmək üçün istifadə etmək imkanını vurğulayır – bu da robototexnikanın gələcəyinə mühüm təsir göstərir.

“Biz insanlar olaraq, dünyanı dərindən dərk etməyə əsaslanan hərəkətləri seçirik və potensial nəticələri əvvəlcədən təxmin edirik” dedi.

https://googleads.g.doubleclick.net/pagead/ads?gdpr=0&us_privacy=1—&gpp_sid=-1&client=ca-pub-0536483524803400&output=html&h=280&slotname=2793866484&adk=2520359048&adf=1100001614&pi=t.ma~as.2793866484&w=750&fwrn=4&fwrnh=0&lmt=1761562290&rafmt=1&armr=3&format=750×280&url=https%3A%2F%2Ftechxplore.com%2Fnews%2F2025-10-deepmind-ai-agent-tasks-scalable.html&fwr=0&rpe=1&resp_fmts=3&wgl=1&aieuf=1&uach=WyJXaW5kb3dzIiwiMTkuMC4wIiwieDg2IiwiIiwiMTQxLjAuNzM5MC41NSIsbnVsbCwwLG51bGwsIjY0IixbWyJHb29nbGUgQ2hyb21lIiwiMTQxLjAuNzM5MC41NSJdLFsiTm90P0FfQnJhbmQiLCI4LjAuMC4wIl0sWyJDaHJvbWl1bSIsIjE0MS4wLjczOTAuNTUiXV0sMF0.&abgtt=6&dt=1761562290586&bpp=1&bdt=151&idt=121&shv=r20251022&mjsv=m202510220101&ptt=9&saldr=aa&abxe=1&cookie=ID%3Dfdc40d724f2dca57%3AT%3D1735367325%3ART%3D1761562219%3AS%3DALNI_MYStQ6fUQQQLyo5Z7z1h-XhXcWBtA&gpic=UID%3D00000f80eacffadc%3AT%3D1735367325%3ART%3D1761562219%3AS%3DALNI_MYaOugky0UawScoidzfbXof3-N-iw&eo_id_str=ID%3D878d521b85743f4c%3AT%3D1751526237%3ART%3D1761562219%3AS%3DAA-AfjZCLruwaFzoQORvGPwXS3Y2&prev_fmts=0x0&nras=1&correlator=2795694702964&frm=20&pv=1&rplot=4&u_tz=240&u_his=1&u_h=1080&u_w=1920&u_ah=1032&u_aw=1920&u_cd=24&u_sd=1&dmc=8&adx=448&ady=2015&biw=1905&bih=945&scr_x=0&scr_y=0&eid=31095144%2C31095375%2C31095409%2C95373975%2C95374289%2C95374626%2C95375703%2C95376000%2C31095398%2C95360684%2C95368094&oid=2&pvsid=2919277523040566&tmod=1104005689&uas=0&nvt=1&ref=https%3A%2F%2Fphys.org%2F&fc=1920&brdim=0%2C0%2C0%2C0%2C1920%2C0%2C1920%2C1032%2C1920%2C945&vis=1&rsz=%7C%7CpeEbr%7C&abl=CS&pfx=0&fu=128&bc=31&plas=164x742_l%7C164x742_r&bz=1&td=1&tdf=2&psd=W251bGwsbnVsbCxudWxsLDNd&nt=1&ifi=2&uci=a!2&btvi=1&fsb=1&dtd=390

“Bu qabiliyyət dünyanın daxili modelini tələb edir və bizə yeni problemləri çox tez həll etməyə imkan verir. Bunun əksinə olaraq, əvvəlki süni intellekt agentləri adətən böyük miqdarda sınaq və səhvlərlə kobud güc vasitəsilə öyrənirlər. Lakin bu, asanlıqla qıra bilən fiziki robotlar kimi tətbiqlər üçün mümkün deyil.”

Son bir neçə il ərzində DeepMind-də hazırlanmış bəzi süni intellekt agentləri kiçik dünya modellərində təlim keçərək Go və Atari kimi oyunlarda böyük uğur qazanıblar . Bununla belə, bu modellərin etibar etdiyi dünya modelləri Minecraft video oyunu kimi daha mürəkkəb dünyalardakı zəngin fiziki qarşılıqlı əlaqəni ələ keçirə bilmədi.

https://www.youtube.com/embed/oDlBtTcX0g0?color=whiteDreamer 4, Minecraft-da ətraf mühitdə təcrübə etmədən yalnız oflayn məlumatlardan brilyant əldə edən ilk agentdir. Agent əvvəlcə dünya modelini öyrənir və sonra müxtəlif təsəvvür edilən ssenarilərdə öyrənməni gücləndirməklə onun davranışını yaxşılaşdırır. Videoda agentin qiymətləndirmə üçün faktiki oyunla qarşılıqlı əlaqəsi göstərilir. Kredit: Google DeepMind.

Digər tərəfdən, ” Veo və Sora kimi video modelləri çox müxtəlif vəziyyətlərdən realist videolar yaratmaq istiqamətində sürətlə təkmilləşir” dedi Hafner.

“Lakin onlar interaktiv deyillər və onların nəsilləri çox yavaşdır, ona görə də onlardan agentləri içəridə yetişdirmək üçün hələlik “neyron simulyatorlar” kimi istifadə edilə bilməz. Dreamer 4-ün məqsədi uğurlu agentləri sırf mürəkkəb dünyaları real şəkildə simulyasiya edə bilən dünya modelləri daxilində yetişdirmək idi.”

Hafner və onun həmkarları Minecraft-dan 20.000-dən çox ardıcıl siçan/klaviatura hərəkətlərinin yerinə yetirilməsini tələb edən sonsuz yaradılan dünyaları və uzun üfüqdə tapşırıqları ehtiva edən mürəkkəb video oyunu olduğundan, onların süni intellekt agenti üçün sınaq yatağı kimi istifadə etmək qərarına gəldilər.

Bu vəzifələrdən biri almaz hasilatıdır ki, bu da agentdən ağacların kəsilməsi, sənətkarlıq alətləri, mədən və filizlərin əridilməsi kimi uzun bir ardıcıl ardıcıllığı yerinə yetirməsini tələb edir.

Qeyd edək ki, tədqiqatçılar öz agentlərini sırf “xəyal edilən” ssenarilərdə öyrətmək istəyirdilər, bunun əvəzinə onun həqiqi oyunda məşq etməsinə icazə vermək əvəzinə, ağıllı robotların simulyasiyada necə öyrənməli olacağına bənzər, çünki onlar birbaşa fiziki dünyada məşq edərkən asanlıqla qıra bilirdilər. Bu, modeldən Minecraft dünyasının kifayət qədər dəqiq daxili modelində obyekt qarşılıqlı əlaqəsini öyrənməyi tələb edir.

Hafner və onun həmkarları tərəfindən hazırlanmış süni agent gələcək müşahidələri, hərəkətləri və konkret vəziyyətlərlə bağlı mükafatları proqnozlaşdırmaq üçün öyrədilmiş böyük transformator modelinə əsaslanır. Dreamer 4, insan oyunçular tərəfindən toplanmış Minecraft oyununun qeydə alınmış videolarını ehtiva edən sabit oflayn verilənlər bazasında təlim keçmişdir.

“Bu təlimi başa vurduqdan sonra Dreamer 4 gücləndirici öyrənmə yolu ilə geniş təsəvvür edilən ssenarilərdə getdikcə daha yaxşı hərəkətləri seçməyi öyrənir” dedi Hafner.

“Ölçülənə bilən dünya modelləri daxilində təlim agentləri generativ süni intellekt sərhədlərini itələməyi tələb edirdi. Biz səmərəli transformator arxitekturası və qısa yol məcburi adlı yeni təlim məqsədi hazırladıq. Bu irəliləyişlər dəqiq proqnozlar verməyə imkan verdi, eyni zamanda adi video modelləri ilə müqayisədə nəsilləri 25 dəfədən çox sürətləndirdi.”Oyna

00:00

00:27SəssizParametrlərPIPTam ekrana daxil olun

Dreamer 4, Minecraft-da yalnız oflayn məlumatlarla məşq edildikdə, heç vaxt öz bacarıqlarını real oyunda tətbiq etmədən brilyant əldə edən ilk süni intellekt agentidir. Bu tapıntı agentin mürəkkəb və uzun üfüqdə olan tapşırıqları necə düzgün həll edəcəyini müstəqil şəkildə öyrənmək qabiliyyətini vurğulayır.

https://googleads.g.doubleclick.net/pagead/ads?gdpr=0&us_privacy=1—&gpp_sid=-1&client=ca-pub-0536483524803400&output=html&h=280&slotname=2793866484&adk=2520359048&adf=2636419947&pi=t.ma~as.2793866484&w=750&fwrn=4&fwrnh=0&lmt=1761562290&rafmt=1&armr=3&format=750×280&url=https%3A%2F%2Ftechxplore.com%2Fnews%2F2025-10-deepmind-ai-agent-tasks-scalable.html&fwr=0&rpe=1&resp_fmts=3&wgl=1&aieuf=1&uach=WyJXaW5kb3dzIiwiMTkuMC4wIiwieDg2IiwiIiwiMTQxLjAuNzM5MC41NSIsbnVsbCwwLG51bGwsIjY0IixbWyJHb29nbGUgQ2hyb21lIiwiMTQxLjAuNzM5MC41NSJdLFsiTm90P0FfQnJhbmQiLCI4LjAuMC4wIl0sWyJDaHJvbWl1bSIsIjE0MS4wLjczOTAuNTUiXV0sMF0.&abgtt=6&dt=1761562290586&bpp=4&bdt=151&idt=212&shv=r20251022&mjsv=m202510220101&ptt=9&saldr=aa&abxe=1&cookie=ID%3Dfdc40d724f2dca57%3AT%3D1735367325%3ART%3D1761562219%3AS%3DALNI_MYStQ6fUQQQLyo5Z7z1h-XhXcWBtA&gpic=UID%3D00000f80eacffadc%3AT%3D1735367325%3ART%3D1761562219%3AS%3DALNI_MYaOugky0UawScoidzfbXof3-N-iw&eo_id_str=ID%3D878d521b85743f4c%3AT%3D1751526237%3ART%3D1761562219%3AS%3DAA-AfjZCLruwaFzoQORvGPwXS3Y2&prev_fmts=0x0%2C750x280&nras=1&correlator=2795694702964&frm=20&pv=1&rplot=4&u_tz=240&u_his=1&u_h=1080&u_w=1920&u_ah=1032&u_aw=1920&u_cd=24&u_sd=1&dmc=8&adx=448&ady=4475&biw=1905&bih=945&scr_x=0&scr_y=0&eid=31095144%2C31095375%2C31095409%2C95373975%2C95374289%2C95374626%2C95375703%2C95376000%2C31095398%2C95360684%2C95368094&oid=2&pvsid=2919277523040566&tmod=1104005689&uas=0&nvt=1&ref=https%3A%2F%2Fphys.org%2F&fc=1920&brdim=0%2C0%2C0%2C0%2C1920%2C0%2C1920%2C1032%2C1920%2C945&vis=1&rsz=%7C%7CpeEbr%7C&abl=CS&pfx=0&fu=128&bc=31&plas=164x742_l%7C164x742_r&bz=1&td=1&tdf=2&psd=W251bGwsbnVsbCxudWxsLDNd&nt=1&ifi=3&uci=a!3&btvi=2&fsb=1&dtd=391

“Sırf oflayn öyrənmək fiziki dünyada məşq edərkən asanlıqla qırıla bilən robotların hazırlanması üçün çox aktualdır” dedi Hafner. “Bizim işimiz ev işlərini və fabrik tapşırıqlarını yerinə yetirən ağıllı robotların yaradılmasına perspektivli yeni yanaşma təqdim edir.”

Tədqiqatçılar tərəfindən həyata keçirilən ilkin sınaqlarda Dreamer 4 agentinin müxtəlif obyektlərin qarşılıqlı təsirlərini və oyun mexanikasını dəqiq proqnozlaşdırdığı və bununla da etibarlı daxili dünya modelini hazırladığı aşkar edilib. Agent tərəfindən qurulan dünya modeli əvvəlki agentlərin etibar etdiyi modelləri əhəmiyyətli fərqlə üstələdi.

“Model tək GPU-da real vaxt rejimində qarşılıqlı əlaqəni dəstəkləyir, bu da insan oyunçuların onun xəyal dünyasını araşdırmasını və onun imkanlarını sınamasını asanlaşdırır”, – Hafner bildirib. “Biz tapırıq ki, model blokların çıxarılması və yerləşdirilməsi, sadə əşyaların hazırlanması və hətta qapılar, sandıqlar və qayıqlardan istifadə dinamikasını dəqiq proqnozlaşdırır.”

Dreamer 4-ün daha bir üstünlüyü ondan ibarətdir ki, o, çox az miqdarda fəaliyyət məlumatları üzrə təlim keçməsinə baxmayaraq, əla nəticələr əldə edib. Bu, əslində Minecraft video oyununda müxtəlif düymələrə və siçan düymələrinə basmağın təsirlərini göstərən video kadrlardır.Oyna

00:00

00:09SəssizParametrlərPIPTam ekrana daxil olun

“Hərəkətlərlə minlərlə saatlıq oyun qeydləri tələb etmək əvəzinə, dünya modeli əslində biliklərinin əksəriyyətini təkcə videodan öyrənə bilər” dedi Hafner.

“Cəmi bir neçə yüz saatlıq fəaliyyət məlumatı ilə dünya modeli daha sonra siçan hərəkətinin və düymələrə basmanın təsirlərini yeni vəziyyətlərə köçürən ümumi şəkildə başa düşür. Bu, həyəcanvericidir, çünki robot məlumatlarının qeydə alınması yavaşdır, lakin internetdə Dreamer 4-ün gələcəkdə öyrənə biləcəyi dünya ilə qarşılıqlı əlaqədə olan insanların çoxlu videoları var.”

Hafner və onun DeepMind-dəki həmkarlarının bu son işi robototexnika sistemlərinin inkişafına töhfə verə bilər, onlara real dünyada əl işlərini etibarlı şəkildə yerinə yetirməyə imkan verən alqoritmlərin təlimini sadələşdirə bilər.

Eyni zamanda, tədqiqatçılar uzunmüddətli yaddaş komponentini birləşdirərək Dreamer 4-ün dünya modelini daha da təkmilləşdirməyi planlaşdırırlar. Bu, agentin təlim aldığı simulyasiya edilmiş dünyaların uzun müddət ərzində ardıcıl qalmasını təmin edərdi.

“Dil anlayışının birləşdirilməsi bizi insanlarla əməkdaşlıq edən və onlar üçün tapşırıqları yerinə yetirən agentlərə yaxınlaşdırar ” deyə Hafner əlavə edib.

“Nəhayət, dünya modelini ümumi internet videolarında öyrətmək agenti fiziki dünya haqqında sağlam düşüncəli biliklərlə təchiz edəcək və bizə müxtəlif təsəvvür edilən ssenarilərdə robotları öyrətməyə imkan verəcək.”

Müəllifimiz İnqrid Fadelli tərəfindən sizin üçün yazılmış , Sadie Harley tərəfindən redaktə edilmiş və Robert Eqan tərəfindən yoxlanılmış və nəzərdən keçirilmiş bu məqalə diqqətli insan əməyinin nəticəsidir. Müstəqil elmi jurnalistikanı yaşatmaq üçün sizin kimi oxuculara güvənirik. Bu hesabat sizin üçün əhəmiyyət kəsb edirsə, lütfən, ianə (xüsusilə aylıq) nəzərdən keçirin. Siz təşəkkür olaraq reklamsız hesab əldə edəcəksiniz .

Ətraflı məlumat: Danijar Hafner et al, Təlim Agentləri Inside of Scalable World Models, arXiv (2025). DOI: 10.48550/arxiv.2509.24527

Jurnal məlumatı: arXiv 

© 2025 Science X Network

Download QRPrint QR

Leave a comment

Sizin e-poçt ünvanınız dərc edilməyəcəkdir. Gərəkli sahələr * ilə işarələnmişdir