#Robototexnika və AI #Xəbərlər

Məkan məlumat dəsti ilə öyrədilmiş robotlar təkmilləşdirilmiş obyektlərin idarə edilməsi və məlumatlılıq nümayiş etdirir

Tatyana Woodall, Ohayo Dövlət Universiteti

Stefani Baum tərəfindən redaktə edilmiş , Robert Eqan tərəfindən nəzərdən keçirilmişdir

 Redaktorların qeydləriKredit: CC0 Public Domain

Ətraflarında naviqasiyaya gəldikdə, maşınların insanlarla müqayisədə təbii bir çatışmazlığı var. Tədqiqatçılar dünyanı anlamaq üçün lazım olan vizual qavrayış bacarıqlarını inkişaf etdirməyə kömək etmək üçün robotlarda məkan şüurunu təkmilləşdirmək üçün yeni bir təlim məlumat dəsti hazırladılar.

Yeni araşdırmada eksperimentlər göstərdi ki, RoboSpatial adlanan bu verilənlər bazası ilə təlim keçmiş robotlar eyni robotik tapşırıqda baza modelləri ilə təlim keçmiş robotlardan daha yaxşı performans göstərərək həm məkan münasibətləri, həm də fiziki obyekt manipulyasiyası haqqında kompleks anlayış nümayiş etdirdilər.

İnsanlar üçün vizual qavrayış , müxtəlif insanları tanımaqdan tutmuş bədənimizin hərəkətləri və mövqeyini dərk etməyə qədər ətraf mühitlə qarşılıqlı əlaqəmizi formalaşdırır. Robotlara bu bacarıqları aşılamaq üçün əvvəlki cəhdlərə baxmayaraq, səylər uğursuz oldu, çünki onların əksəriyyəti mükəmməl məkan anlayışı olmayan məlumatlar üzərində təlim keçib.

Tədqiqatın aparıcı müəllifi və hazırkı fəlsəfə doktoru Luke Sonq bildirib ki, intuitiv qarşılıqlı əlaqə üçün dərin məkan qavrayışı zəruri olduğundan, həll edilməsə, bu fəza əsaslandırma problemləri gələcək süni intellekt sistemlərinin mürəkkəb təlimatları dərk etmək və dinamik mühitlərdə işləmək qabiliyyətinə mane ola bilər. Ohio Dövlət Universitetində mühəndislik üzrə tələbə.

“Əsl ümumi təyinatlı təməl modellərinə sahib olmaq üçün robot ətrafındakı 3D dünyasını başa düşməlidir” dedi. “Beləliklə, məkan anlayışı onun üçün ən vacib imkanlardan biridir.”

Tədqiqat bu yaxınlarda Kompüter Görmə və Pattern Tanınma Konfransında şifahi təqdimat kimi təqdim edilmişdir . İş 2025 IEEE/CVF Konfransı Kompüter Görmə və Pattern Tanınması (CVPR) jurnalında dərc edilmişdir .

https://googleads.g.doubleclick.net/pagead/ads?gdpr=0&us_privacy=1—&gpp_sid=-1&client=ca-pub-0536483524803400&output=html&h=280&slotname=2793866484&adk=161300458&adf=1100001614&pi=t.ma~as.2793866484&w=540&fwrn=4&fwrnh=0&lmt=1763107713&rafmt=1&armr=3&format=540×280&url=https%3A%2F%2Ftechxplore.com%2Fnews%2F2025-11-robots-spatial-dataset-awareness.html&fwr=0&rpe=1&resp_fmts=3&wgl=1&aieuf=1&aicrs=1&uach=WyJXaW5kb3dzIiwiMTUuMC4wIiwieDg2IiwiIiwiMTQxLjAuNzM5MC4xMjMiLG51bGwsMCxudWxsLCI2NCIsW1siR29vZ2xlIENocm9tZSIsIjE0MS4wLjczOTAuMTIzIl0sWyJOb3Q_QV9CcmFuZCIsIjguMC4wLjAiXSxbIkNocm9taXVtIiwiMTQxLjAuNzM5MC4xMjMiXV0sMF0.&abgtt=6&dt=1763107713233&bpp=1&bdt=328&idt=87&shv=r20251112&mjsv=m202511100101&ptt=9&saldr=aa&abxe=1&cookie=ID%3D2084a3530b57cebb%3AT%3D1763107662%3ART%3D1763107662%3AS%3DALNI_MaQ2aLD6HYvvGUF2VMq5I7R3bvVCA&gpic=UID%3D000012c88dc0f8c5%3AT%3D1763107662%3ART%3D1763107662%3AS%3DALNI_MZFcPhAPDOmzstgDs9vu2KnEWzkqA&eo_id_str=ID%3D26eec303b863be34%3AT%3D1763107662%3ART%3D1763107662%3AS%3DAA-AfjaDtkYaLaLDriceNQmu6m4v&prev_fmts=0x0&nras=1&correlator=4449212429883&frm=20&pv=1&rplot=4&u_tz=240&u_his=1&u_h=864&u_w=1536&u_ah=816&u_aw=1536&u_cd=24&u_sd=1.25&dmc=8&adx=395&ady=2115&biw=1521&bih=730&scr_x=0&scr_y=0&eid=31095753%2C42531705%2C95376583%2C95376902%2C95377330%2C95377334%2C31095772%2C95376120&oid=2&pvsid=329194323051213&tmod=362063203&uas=0&nvt=1&ref=https%3A%2F%2Fphys.org%2F&fc=1920&brdim=0%2C0%2C0%2C0%2C1536%2C0%2C1536%2C816%2C1536%2C730&vis=1&rsz=%7C%7CpeEbr%7C&abl=CS&pfx=0&fu=128&bc=31&plas=181x574_l%7C181x574_r&bz=1&td=1&tdf=2&psd=W251bGwsbnVsbCxudWxsLDNd&nt=1&ifi=2&uci=a!2&btvi=1&fsb=1&dtd=287

Robotlara perspektivi daha yaxşı şərh etməyi öyrətmək üçün RoboSpatial bir milyondan çox real dünyadakı qapalı və masa üstü şəkilləri, minlərlə ətraflı 3D skanları və robototexnika ilə əlaqəli zəngin məkan məlumatlarını təsvir edən 3 milyon etiketdən ibarətdir. Bu geniş resurslardan istifadə edərək, çərçivə 2D eqosentrik şəkilləri eyni səhnənin tam 3D skanları ilə cütləşdirir, beləliklə model ya düz təsvirin tanınması və ya 3D həndəsəsindən istifadə edərək obyektləri dəqiq təyin etməyi öyrənir.

Araşdırmaya görə, bu, real dünyada vizual işarələri yaxından təqlid edən bir prosesdir.

Məsələn, hazırkı təlim məlumat dəstləri robota “masanın üstündəki qabı” dəqiq təsvir etməyə imkan versə də, model onun masanın harada olduğunu, əlçatan qalmaq üçün harada yerləşdirilməli olduğunu və ya digər obyektlərlə necə uyğunlaşa biləcəyini ayırd etmək qabiliyyətindən məhrum olacaq. Bunun əksinə olaraq, RoboSpatial, ilk növbədə obyektin yenidən qurulmasını nümayiş etdirməklə, sonra isə modellərin orijinal təlim məlumatlarından kənarda yeni məkan əsaslandırma ssenarilərinə ümumiləşdirmə qabiliyyətini yoxlamaq yolu ilə praktiki robotik tapşırıqlarda bu məkan əsaslandırma bacarıqlarını ciddi şəkildə sınaqdan keçirə bilər.

“Bu, təkcə əşyaların götürülməsi və yerləşdirilməsi kimi fərdi hərəkətlərin təkmilləşdirilməsi demək deyil, həm də robotların insanlarla daha təbii qarşılıqlı əlaqəyə girməsinə gətirib çıxarır” dedi Song.

Komandanın bu çərçivəni sınaqdan keçirdiyi sistemlərdən biri əlilliyi olan insanlara ətraf mühitlə əlaqə saxlamağa kömək edən köməkçi qol olan Kinova Jaco robotu idi.

Təlim zamanı “Stul stolun qarşısına qoyula bilərmi?” kimi sadə qapalı fəza suallarına cavab verə bildi. və ya “Kupça laptopun solundadır?” düzgün.

Bu ümidverici nəticələr göstərir ki, robot qavrayışını yaxşılaşdırmaqla məkan kontekstini normallaşdırmaq daha təhlükəsiz və daha etibarlı AI sistemlərinə gətirib çıxara bilər, Song bildirib.

Süni intellektin inkişafı və təlimi ilə bağlı hələ də çoxlu cavabsız suallar olsa da, iş RoboSpatial-ın robototexnika sahəsində daha geniş tətbiqlər üçün təməl rolunu oynama potensialına malik olduğu qənaətinə gəlir və daha maraqlı məkan irəliləyişlərinin çox güman ki, ondan ayrılacağını qeyd edir.

“Düşünürəm ki, biz yaxın beş-on il ərzində robotlar üçün çox böyük təkmilləşdirmələr və gözəl imkanlar görəcəyik” dedi Song.

Həmmüəlliflər arasında Ohayo ştatından Yu Su və NVIDIA-dan Valts Blukis, Conatan Tremblay, Stephen Tyree və Stan Birchfield var.

Ətraflı məlumat: Chan Hee Song et al, RoboSpatial: Teaching Spatial Understanding to 2D and 3D Vision-Language Models for Robotics, 2025 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR) (2025). DOI: 10.1109/cvpr52734.2025.01470Ohayo Dövlət Universiteti tərəfindən təmin edilmişdir 


Daha çox araşdırın

Vizyon dili modelləri süni dünyalar və 3D səhnə təsvirləri vasitəsilə məkan əsaslandırma bacarıqları əldə edirlər.

Download QRPrint QR

Leave a comment

Sizin e-poçt ünvanınız dərc edilməyəcəkdir. Gərəkli sahələr * ilə işarələnmişdir