Robot bax, robot edir: Sistem necə ediləcəyini videolarına baxdıqdan sonra öyrənir

Kornell Universitetinin tədqiqatçıları süni intellektlə işləyən yeni robotik çərçivə hazırlayıblar – RHyME (Uyğunsuz icra altında hibrid təqlid üçün axtarış) – bu, robotlara tək “necə etməli” videosuna baxaraq tapşırıqları öyrənməyə imkan verir.
Robotlar incə öyrənənlər ola bilər. Tarixən, onlar əsas tapşırıqları yerinə yetirmək üçün dəqiq, addım-addım təlimat tələb etmişlər və aləti atdıqdan və ya vintini itirdikdən sonra işlər skriptdən kənara çıxanda onu dayandırmağa meyllidirlər. Tədqiqatçıların dediyinə görə, RHyME robot sistemlərinin hazırlanması və öyrədilməsi üçün lazım olan vaxtı, enerjini və pulu əhəmiyyətli dərəcədə azaldaraq onların inkişafı və yerləşdirilməsini sürətləndirə bilər.
Kompüter elmləri sahəsində doktorant Kuşal Kedia, “Robotlarla işləməkdə zəhlətökən şeylərdən biri robotun müxtəlif tapşırıqları yerinə yetirməsi haqqında çoxlu məlumat toplamaqdır ” dedi. “İnsanlar tapşırıqları belə yerinə yetirmirlər. Biz başqa insanlara ilham kimi baxırıq.”
Kedia may ayında Atlantada Elektrik və Elektronika Mühəndisləri İnstitutunun Robototexnika və Avtomatlaşdırma üzrə Beynəlxalq Konfransında “Uyğunsuz icrada bir vuruşun təqlidi” adlı məqalə təqdim edəcək. İş həm də arXiv preprint serverində mövcuddur .
Ev robotlarının köməkçiləri hələ də çox uzaqdadırlar, çünki onların fiziki dünyanı və onun saysız-hesabsız gözlənilməz hadisələrini idarə etmək üçün ağlı yoxdur. Robotları sürətləndirmək üçün Kedia kimi tədqiqatçılar onlara laboratoriya şəraitində müxtəlif tapşırıqların insan nümayişi kimi videoları öyrədirlər. Maşın öyrənməsinin “imitasiya öyrənmə” adlı bir qolu olan bu yanaşmanın ümidi robotların bir sıra tapşırıqları daha sürətli öyrənməsi və real dünya mühitinə uyğunlaşa bilməsidir.Oyna
00:0000:13SəssizParametrlərPIPTam ekrana daxil olun
“Bizim işimiz fransız dilini ingilis dilinə tərcümə etmək kimidir – biz istənilən tapşırığı insandan robota tərcümə edirik” dedi baş müəllif Sanjiban Choudhury, kompüter elmləri professoru.
Bununla belə, bu tərcümə işi hələ də daha geniş bir problemlə üzləşir: İnsanlar robotun izləməsi və təqlid etməsi üçün çox axıcı hərəkət edir və robotları video ilə məşq etmək onun həddən artıq işləməsini tələb edir. Bundan əlavə, video nümayişləri – məsələn, salfet götürmək və ya yemək boşqablarını yığmaq – yavaş və qüsursuz şəkildə aparılmalıdır, çünki video ilə robot arasındakı hərəkətlərdə hər hansı uyğunsuzluq tarixən robot öyrənməsi üçün əzab verir.
https://googleads.g.doubleclick.net/pagead/ads?client=ca-pub-0536483524803400&output=html&h=280&slotname=2793866484&adk=2520359048&adf=1293340994&pi=t.ma~as.2793866484&w=750&abgtt=6&fwrn=4&fwrnh=0&lmt=1745414521&rafmt=1&armr=3&format=750×280&url=https%3A%2F%2Ftechxplore.com%2Fnews%2F2025-04-robot-videos.html&fwr=0&rpe=1&resp_fmts=3&wgl=1&uach=WyJXaW5kb3dzIiwiMTkuMC4wIiwieDg2IiwiIiwiMTM1LjAuNzA0OS45NiIsbnVsbCwwLG51bGwsIjY0IixbWyJHb29nbGUgQ2hyb21lIiwiMTM1LjAuNzA0OS45NiJdLFsiTm90LUEuQnJhbmQiLCI4LjAuMC4wIl0sWyJDaHJvbWl1bSIsIjEzNS4wLjcwNDkuOTYiXV0sMF0.&dt=1745414521139&bpp=1&bdt=392&idt=47&shv=r20250421&mjsv=m202504170101&ptt=9&saldr=aa&abxe=1&cookie=ID%3Dfdc40d724f2dca57%3AT%3D1735367325%3ART%3D1745403618%3AS%3DALNI_MYStQ6fUQQQLyo5Z7z1h-XhXcWBtA&gpic=UID%3D00000f80eacffadc%3AT%3D1735367325%3ART%3D1745403618%3AS%3DALNI_MYaOugky0UawScoidzfbXof3-N-iw&eo_id_str=ID%3De43bb863646b60b8%3AT%3D1735367325%3ART%3D1745403618%3AS%3DAA-AfjbQoPwZqH28q9IwcCLRSzzg&prev_fmts=0x0&nras=1&correlator=4898560059912&frm=20&pv=1&rplot=4&u_tz=240&u_his=1&u_h=1080&u_w=1920&u_ah=1032&u_aw=1920&u_cd=24&u_sd=1&dmc=8&adx=448&ady=1943&biw=1905&bih=945&scr_x=0&scr_y=0&eid=95330276%2C95353387%2C95354563%2C95357460%2C95357877%2C95356661%2C95356809%2C95357715&oid=2&pvsid=3228371811377111&tmod=304292572&uas=0&nvt=1&ref=https%3A%2F%2Fphys.org%2F&fc=1920&brdim=0%2C0%2C0%2C0%2C1920%2C0%2C1920%2C1032%2C1920%2C945&vis=1&rsz=%7C%7CpeEbr%7C&abl=CS&pfx=0&fu=128&bc=31&bz=1&td=1&tdf=2&psd=W251bGwsbnVsbCxudWxsLDNd&nt=1&ifi=5&uci=a!5&btvi=1&fsb=1&dtd=53
“Əgər bir insan robotun hərəkətindən fərqli bir şəkildə hərəkət edərsə, üsul dərhal dağılır” dedi Choudhury. “Bizim düşüncəmiz belə idi: “İnsanların və robotların tapşırıqları yerinə yetirmələri arasındakı bu uyğunsuzluğu aradan qaldırmaq üçün prinsipial bir yol tapa bilərikmi?”
RHyME komandanın cavabıdır – robotları daha az zərif və daha uyğunlaşdıran miqyaslı yanaşma. O, öz yaddaşından istifadə etmək və yalnız bir dəfə baxdığı tapşırıqları yerinə yetirərkən nöqtələri birləşdirmək üçün robot sistemini gücləndirir. Məsələn, RHyME ilə təchiz edilmiş robot, piştaxtadan fincan götürüb yaxınlıqdakı lavaboya yerləşdirən bir insanın videosunu nümayiş etdirdi, videolar bankını darayacaq və stəkan tutmaq və qabı endirmək kimi oxşar hərəkətlərdən ilham alacaq.
Tədqiqatçılar bildiriblər ki, RHyME robotların çox addımlı ardıcıllığı öyrənməsinə yol açır, eyni zamanda təlim üçün tələb olunan robot məlumatlarının miqdarını əhəmiyyətli dərəcədə azaldır. RHyME yalnız 30 dəqiqə robot məlumat tələb edir; Tədqiqatçıların dediyinə görə, laboratoriya şəraitində sistemdən istifadə etməklə öyrədilmiş robotlar əvvəlki metodlarla müqayisədə tapşırıqların müvəffəqiyyətində 50%-dən çox artım əldə ediblər.
“Bu iş robotların bu gün proqramlaşdırılma tərzindən fərqlidir. Robotların proqramlaşdırılmasının status-kvosu robota tapşırıqları yerinə yetirməyi öyrətmək üçün minlərlə saatlıq tele-əməliyyatdır. Bu, sadəcə olaraq mümkün deyil”, – Choudhury deyib. “RHyME ilə biz bundan uzaqlaşırıq və robotları daha miqyaslı şəkildə öyrətməyi öyrənirik.”
Kedia və Choudhury ilə yanaşı, məqalənin müəllifləri Prithwish Dan, Angela Chao və Maximus Pacedir.
Daha çox məlumat: Kushal Kedia və başqaları, Uyğunsuz İcra altında Bir Atış Təqlidi, arXiv (2024). DOI: 10.48550/arxiv.2409.06615
Jurnal məlumatı: arXiv Cornell Universiteti tərəfindən təmin edilmişdir