Speech-to reality sistemi süni intellekt və robot texnikasından istifadə edərək tələb olunan obyektlər yaradır
Denise Brehm, Massaçusets Texnologiya İnstitutu
Lisa Lock tərəfindən redaktə edilmiş , Robert Eqan tərəfindən nəzərdən keçirilmişdir
Redaktorların qeydləriRobot qol “Mən sadə tabure istəyirəm” sorğusunu eşitdikdən sonra şəbəkəyə bənzər nəcis düzəldir və sistemin nitqi real vaxtda uydurmaya necə çevirdiyini nümayiş etdirir. Kredit: Alexander Kyaw və tədqiqatçılar
Generativ süni intellekt və robototexnika bizi bir neçə dəqiqə ərzində obyekt tələb edə biləcəyimiz günə yaxınlaşdırır. Əslində, MIT tədqiqatçıları robot qola giriş təmin etməyə və beş dəqiqə ərzində mebel kimi şeylər yaratmağa imkan verən süni intellektlə idarə olunan iş prosesini inkişaf etdiriblər.
Danışıqdan reallığa çevirmə sistemi ilə stolun üzərinə quraşdırılmış robot qolu insandan “Mən sadə tabure istəyirəm” kimi şifahi məlumatı qəbul edə və sonra modul komponentlərdən obyektlər qura bilir. Tədqiqatçılar bu günə qədər sistemdən taburelər, rəflər, stullar, kiçik masa və hətta it heykəli kimi bəzək əşyaları yaratmaq üçün istifadə ediblər.
MIT aspirantı və Morninqsayd Dizayn Akademiyasının (MAD) əməkdaşı Alexander Htet Kyaw, “Biz təbii dil emalını, 3D generativ süni intellekt və robotik montajı birləşdiririk” deyir. “Bunlar daha əvvəl bir araya gətirilməyən sürətlə inkişaf edən tədqiqat sahələridir ki, sadəcə sadə nitq sorğusundan fiziki obyektlər yarada bilərsiniz.”
İdeya Memarlıq və Elektrik Mühəndisliyi və Kompüter Elmləri fakültələrinin aspirantı olan Kyaw professor Neil Gershenfeld-in “Demək olar ki, hər şeyi necə etmək olar” kursunu keçəndə başladı. Həmin sinifdə o, nitqdən reallığa sistemi qurdu. O, Maşınqayırma Departamentinin aspirantları Se Hwan Jeon və AMB-dən Miana Smit ilə əməkdaşlıq edərək Gershenfeld tərəfindən idarə olunan MIT-nin Bitlər və Atomlar Mərkəzində (AMM) layihə üzərində işləməyə davam etdi.
Danışıq-gerçəklik sistemi necə işləyir
Nitqdən reallığa sistemi istifadəçinin sorğusunu böyük dil modelindən istifadə edərək emal edən nitqin tanınması ilə başlayır, ardınca obyektin rəqəmsal şəbəkə təsvirini yaradan 3D generativ AI və 3D şəbəkəni montaj komponentlərinə ayıran vokselləşdirmə alqoritmi.
Bundan sonra, həndəsi emal süni intellekt tərəfindən yaradılan montajı dəyişdirir və komponentlərin sayı, həndəsə keçidləri və əlaqə kimi real dünya ilə əlaqəli fiziki məhdudiyyətləri nəzərə alır. Bunun ardınca istifadəçi göstərişlərindən fiziki obyektlərin yığılması üçün robot qolu üçün mümkün montaj ardıcıllığının yaradılması və avtomatlaşdırılmış yolun planlaşdırılması aparılır.
Təbii dildən istifadə etməklə sistem 3D modelləşdirmə və ya robot proqramlaşdırma sahəsində təcrübəsi olmayan insanlar üçün dizayn və istehsalı daha əlçatan edir. Və saatlar və ya günlər çəkə bilən 3D çapdan fərqli olaraq, bu sistem bir neçə dəqiqə ərzində qurulur.
“Bu layihə ətrafımızdakı dünyanı birlikdə yaratmaq üçün insanlar, süni intellekt və robotlar arasında bir interfeysdir” dedi Kyaw. “Mən bir stul istəyirəm” dediyiniz bir ssenari təsəvvür edin və beş dəqiqə ərzində qarşınızda fiziki bir stul əmələ gəlir.””İki pilləli rəf” və “Mən hündür it istəyirəm” kimi səs əmrlərinə cavab olaraq robot qolu tərəfindən qurulan taburelər, masalar və dekorativ formalar kimi obyektlərin nümunələri. Kredit: Alexander Kyaw və tədqiqatçılar
Gələcək təkmilləşdirmələr və daha geniş baxış
Komandanın kubları maqnitdən daha möhkəm birləşmələrə birləşdirən vasitələri dəyişdirərək, mebelin ağırlıq daşıma qabiliyyətini təkmilləşdirmək üçün dərhal planları var.
“Biz həmçinin kiçik, paylanmış mobil robotlar üçün voksel strukturlarını mümkün montaj ardıcıllığına çevirmək üçün boru kəmərləri hazırlamışıq ki, bu da bu işi istənilən ölçülü miqyasda strukturlara tərcümə etməyə kömək edə bilər” Smith deyir.
Modul komponentlərdən istifadənin məqsədi fiziki obyektləri sökərək və sonra onları başqa bir şeyə yığmaq yolu ilə tullantıları aradan qaldırmaqdır, məsələn, artıq divana ehtiyacınız olmadıqda divanı çarpayıya çevirmək.
Kyaw həmçinin istehsal prosesində robotlarla qarşılıqlı əlaqə yaratmaq üçün jestlərin tanınması və artırılmış reallıqdan istifadə təcrübəsinə malik olduğundan , o, hazırda nitqdən reallıq sisteminə həm nitq, həm də jest nəzarətini daxil etmək üzərində işləyir.
“Ulduz yolu” franşizasındakı replikator və “Böyük Qəhrəman 6” cizgi filmindəki robotlar haqqında xatirələrinə söykənən Kyaw öz baxışlarını izah edir.
“Mən insanların fiziki obyektləri sürətli, əlçatan və davamlı şəkildə düzəltmək üçün əlçatanlığını artırmaq istəyirəm” deyir. “Mən maddənin mahiyyətinin həqiqətən sizin nəzarətinizdə olduğu bir gələcəyə doğru çalışıram. İstənilən halda reallığın yaradıla biləcəyi bir gələcək.”
Komanda noyabrın 21-də MIT-də keçirilən Hesablama Maşınları Assosiasiyasının (ACM) Hesablama Maşınları üzrə Simpoziumda (SCF ’25) “Reallığa nitq: Təbii Dildən istifadə edərək Tələb Üzrə İstehsal, 3D Generativ AI və Diskret Robotik Assambleya” adlı məqaləsini təqdim etdi .
Daha çox məlumat: Alexander Htet Kyaw və digərləri, Reallığa nitq: Təbii Dildən istifadə edərək Tələb Üzrə İstehsal, 3D Generativ AI və Diskret Robot Assambleyası, Hesablama İstehsalına dair ACM Simpoziumunun materialları (2025). DOI: 10.1145/3745778.3766670Massaçusets Texnologiya İnstitutu tərəfindən təmin edilmişdir














