Süni intellekt bir video oyuna baxaraq insanlara necə təsir etməyi öyrəndi
Bu , süni intellektin inkişaf edən istifadəsinin həyatımıza necə təsir etdiyini və bu təsirləri mümkün qədər faydalı etmək üçün işləyə biləcəyimiz yolları müəyyən edən bir il davam edən hekayələr seriyasından başqa bir şeydir .
Əgər kimsə ilə yemək bişirmisinizsə, bunun koordinasiya tələb olunduğunu bilirsiniz. Bunu bir nəfər kəsir. Digəri bunu qarışdırır. Bəzən bir şey etmək istədiyiniz zaman bir-birinizə inqrediyentlər və ya alətlər verə bilərsiniz. Bəs robot bu cür komanda işini necə idarə edə bilər? Son bir araşdırma bəzi ipuçlarını təqdim edir.
Süni intellekt və ya süni intellekt insanların Overcooked oyununu oynamasını izlədi . Bununla da AI modeli oyunu mənimsəyə bildi. Ancaq sonra daha da irəli getdi. O, həmçinin daha yaxşı qərarlar qəbul etmək üçün insan komanda yoldaşlarını necə dürtleyebileceğini öyrənmişdi.
Tədqiqatçılar bu tapıntıları keçən dekabr ayında paylaşdılar. Onlar işi Neyro İnformasiya Emalı Sistemləri görüşündə təqdim ediblər. O, Nyu-Orleanda, La-da keçirilib.
Tərbiyəçilər və Valideynlər, Fırıldaq Vərəqinə Qeydiyyatdan Keçin
Tədris mühitində Science News Explores istifadə etməyinizə kömək edəcək həftəlik yeniləmələrE-poçt ünvanı*Get
Stefanos Nikolaidis deyir ki, bu araşdırma “vacib və uyğun problemi” həll edir. Yəni: AI insanlara təsir etməyi necə öyrənə bilər. Nikolaidis yeni işdə iştirak etmədi. Lakin o, Los-Ancelesdəki Cənubi Kaliforniya Universitetində interaktiv robotlar üzrə təhsil alır.
Gələcəkdə insanlar çox güman ki, süni intellektlə getdikcə daha sıx işləyəcəklər. Bəzən biz AI-nin hər hansı yaxşı komanda yoldaşı kimi seçimlərimizə rəhbərlik etməyə kömək etməsini istəyə bilərik. Amma biz həm də süni intellektin bizim seçimlərimizə bəyənmədiyimiz yollarla nə vaxt təsir etdiyini deyə bilmək istəyirik. Bəzi insanlar bu şəkildə hərəkət etmək üçün AI dizayn etməyə çalışa bilər. Və ya bir gün süni intellekt bunu təkbaşına etməyə qərar verə bilər.
Bu səbəblərə görə, süni intellektin insanların necə qərar qəbul etmələrini necə və nə qədər öyrənə biləcəyini öyrənmək vacibdir.
Baxaraq öyrənin
Yeni araşdırma üçün Berkli Kaliforniya Universitetində bir qrup AI-yə Overcooked oyununu öyrətdi . Bu video oyununda iki oyunçu yemək hazırlamaq və xidmət etmək üçün birlikdə işləyir. Süni intellekt oyunçularını yetişdirmək üçün tədqiqatçılar əvvəlcə oyunu oynayan cütlüklərdən məlumat topladılar. Sonra bu məlumatlardan süni intellektə dörd fərqli şəkildə oynamağı öyrətmək üçün istifadə etdilər.
İlk məşq metodunda AI sadəcə insan oyunçuların gördüklərini təqlid etdi. İkincidə, süni intellekt ən yaxşı insan oyunçular tərəfindən edilən hərəkətləri təqlid etdi. Üçüncü təlim metodu insan məlumatlarına məhəl qoymadı. Burada iki AI bir-biri ilə məşq edərək öyrənildi. Dördüncü üsulda oflayn gücləndirmə öyrənmə və ya RL adlı bir texnika istifadə edilmişdir.
Gəlin süni intellekt haqqında öyrənək
Oflayn RL-də süni intellekt insan komandalarına baxaraq Overcooked oynamağı öyrəndi . Ancaq bu, sadəcə onların hərəkətlərini təqlid etmədi. Gördüklərinin ən yaxşı hissələrini birləşdirdi. Bu, ona həqiqətən izlədiyi insanlardan daha yaxşı oynamağa imkan verdi.
Təlimdən sonra AI-lər insanlarla Overcooked oynadılar. Həmin komandalar oyunun iki versiyasını oynadılar. Bunlardan biri “insan-təslim” versiyası idi. Bu, insan tərəfdaşı yeməyi təqdim edərsə, bir komanda ikiqat xal qazandı. Digər versiya isə “pomidor-bonus” versiyası idi. Burada komandalar soğansız pomidorla şorba versələr, ikiqat xal qazandılar.
Əsas odur ki, insanlara heç vaxt ikiqat nöqtə qaydaları söylənməyib. Beləliklə, AI-lər bu gizli qaydalara riayət etmək üçün insan komanda yoldaşlarını dürtməli idilər.
İnsan-təslim oyununda oflayn RL-dən istifadə etməklə təlim keçmiş süni intellektə malik komandalar orta hesabla 220 xal topladılar. Bu, növbəti ən yaxşı AI-təlim metodlarından təxminən 50 faiz çox bal idi. Pomidor bonus oyununda oflayn RL tərəfindən məşq edilmiş süni intellektə malik komandalar orta hesabla 165 xal topladılar və ya digər komandaların topladığı xaldan təxminən iki dəfə çox.
Oflayn RL ilə öyrədilmiş süni intellektə daha yaxından baxmaq onun komandalarının bu qədər yaxşı nəticə əldə etmələrinin bir səbəbini ortaya qoydu. Süni intellekt insan tərəfdaşının yeməyi çatdırmasını istədikdə, piştaxtanın üstünə bir qab qoyardı.
Bu sadə səslənə bilər. Lakin süni intellekt təlimi zamanı insanların bunu etdiyinə dair heç bir nümunə görmədi. Gördü ki, kimsə qab qoyur. Və elə vaxtlar olurdu ki, kimsə qab götürür. Ancaq görünür, süni intellekt bu hərəkətləri bir-birinə yapışdırmağın dəyərini anladı: Bunu etməklə, insan partnyoru yemək təqdim etdi və ikiqat xal qazandı.
https://www.youtube.com/embed/MuK5NrKN9-4?feature=oembed&enablejsapi=1&origin=https:%2F%2Fwww.snexplores.orgİnsan (solda) və AI (sağda) tərkibində pomidor (qırmızı və yaşıl obyektlər) və/və ya soğan (bej obyektlər) olan şorba bişirmək üçün birlikdə işləyir. Bu halda, süni intellekt (insan deyil) bilir ki, insan şorba verərsə, komanda ikiqat xal qazanacaq. Videonun ikinci yarısı süni intellektin ocağın yanında qab (ağ dairə) qoysa, insanı ondan istifadə etməyə və şorba çatdırmağa vadar edə biləcəyini necə başa düşdüyünü göstərir.
İnsan davranışını pozmaq
Strateji qabların yerləşdirilməsi süni intellektə insanın növbəti hərəkətinə təsir göstərməyə imkan vermiş ola bilər. Ancaq süni intellekt yalnız bir addımdan çoxunu əhatə edən bir insanın ümumi strategiyasını müəyyən edə, sonra təsir göstərə bilərmi?
Bunu öyrənmək üçün Berkeley komandası süni intellekt modelini dəyişdirdi. İndi o, seçimlərini oyunun hazırkı vəziyyətindən daha çox əsaslandırdı. Süni intellektə indi də gələcək oyun planını hazırlamaq üçün tərəfdaşının keçmiş hərəkətlərini nəzərdən keçirmək tapşırıldı.
Həm orijinal, həm də dəyişdirilmiş AI modelləri oflayn RL istifadə edərək Overcooked-i öyrəndi. İki model daha sonra insan tərəfdaşları ilə Overcooked oynadı. Tərəfdaşının strategiyasını anlaya bilən, təxminən 50 faiz daha çox bal topladı. Məsələn, pomidor-bonus oyununda süni intellekt ortağı soğanları tək buraxana qədər onları bloklamağı öyrəndi.
Elmi sualınız var? Biz kömək edə bilərik!
Sualınızı burada təqdim edin və biz ona Science News Explores jurnalının qarşıdan gələn sayında cavab verə bilərik
Rohan Paleja süni intellektin keçmiş insan oyunlarına baxaraq Overcooked oynamağı öyrənə biləcəyinə heyran qalır . Möhkəmləndirici öyrənmənin digər növləri süni intellektə insan repetitorları ilə işləməyi əhatə edir. Lakin bir çox tapşırıqlar üçün bu, vaxt apara bilər və ya hətta həmin insan təlimçilərinə zərər verə bilər. Süni intellekt tərtibatçıları həmçinin süni intellektə öyrətmək üçün insan repetitorları kimi çıxış edən kompüter modelləri yarada bilərlər . Ancaq insanların etdiklərini real şəkildə təqlid edən modellər yaratmaq olduqca çətindir.
Paleja deyir ki, süni intellektin izləyərək öyrəndiyi buradakı üsul “bir çox real dünya problemlərinə tətbiq olunur”. Bu kompüter alimi Massaçusets Texnologiya İnstitutunun bir hissəsidir, Leksinqtonda, Linkoln Laboratoriyasında işləyir.
Yaxşı və ya pis üçün
Gələcəkdə mətbəxlərdə, anbarlarda və xəstəxanalarda AI tərəfdaşları ilə işləyə bilərik. Emma Brunskill deyir ki, insanları daha yaxşı seçimlər etməyə sövq edə bilən süni intellekt “insanların məqsədlərinə çatmağın ən yaxşı yolunu bilmədiklərində onlara dəstək ola bilər”. Kaliforniyadakı Stanford Universitetində kompüter alimidir. O, yeni tədqiqatda iştirak etməyib.
Brunskill təklif edir ki, süni intellekt insanları məqsədlərinə çatmağa sövq etmək üçün sağlamlıq proqramlarından alınan məlumatlara baxa bilər. Və ya insanları xeyriyyəçilik üçün daha çox ianə verməyə təşviq edə bilər.
Lakin belə təsirin daha qaranlıq tərəfi də ola bilər. “Onlayn tövsiyə sistemləri, məsələn, bizi daha çox almağa çalışa bilər” dedi Brunskill. “Və ya daha çox televizora baxın.”
Sizin üçün asan, robot üçün çətin
Süni intellekt kömək etmək niyyətində olsa belə, bizi bəyənmədiyimiz üsullarla manipulyasiya edə bilər, Micah Carroll əlavə edir. O, UC Berkeley-də kompüter alimidir, lakin yeni tədqiqatda iştirak etməyib.
Carroll, AI-nin Overcooked oyununda insanın yolunu necə kəsdiyinə işarə edir . Bu davranış süni intellektin sadəcə komandasına xal qazandırmağa çalışdığı bir video oyununda yaxşı ola bilər. Ancaq insanların başqa yerlərə və ya məlumatlara çıxışını əngəlləyən süni intellekt təsəvvür edin. Süni intellekt insanlar üçün ən yaxşısını etdiyini düşünsə belə, bu təhlükəli ola bilər.
Yeni araşdırma göstərir ki, ən yaxşısını bildiyini düşünən və insanları onun rəhbərliyinə əməl etməyə istiqamətləndirə bilən süni intellekt yaratmaq artıq mümkündür. Carroll deyir ki, elm adamlarının süni intellektə hansı təsir növləri ilə uyğun olduqlarını söyləmək üçün hələ yaxşı yolları yoxdur. “Məsələn, “Mən süni intellektlə konkret strategiya üçün mübahisə etməyə çalışıram, amma istəmirəmsə, məni bunu etməyə məcbur etmirəm”.
Güclü Sözlər
süni intellekt : Maşınlar və ya kompüterlər tərəfindən nümayiş etdirilən biliyə əsaslanan qərar qəbuletmə növü. Termin eyni zamanda elm adamlarının ağıllı davranışa qadir olan maşınlar və ya kompüter proqramları yaratmağa çalışdıqları tədqiqat sahəsinə də aiddir.
orta : (elmdə) Arifmetik orta üçün termin, sonra qrupun ölçüsünə bölünən ədədlər qrupunun cəmidir.
davranış : Bir şeyin, çox vaxt insanın və ya başqa bir orqanizmin başqalarına qarşı hərəkəti və ya özünü aparması.
kompüter modeli : Real dünya xüsusiyyətinin, fenomeninin və ya hadisəsinin modelini və ya simulyasiyasını yaradan kompüterdə işləyən proqram.
data : Faktlar və/və ya statistik məlumatlar təhlil üçün birlikdə toplanmış, lakin onlara məna verəcək şəkildə təşkil edilməməlidir. Rəqəmsal məlumat üçün (kompüterlər tərəfindən saxlanılan növ) bu məlumatlar adətən ikili kodda saxlanılan, sıfır və bir sətirləri kimi təsvir edilən nömrələrdir.
məlumat : (məlumatlardan fərqli olaraq) Verilən faktlar və ya bir şey və ya kimsə haqqında öyrənilən meyllər, çox vaxt məlumatların öyrənilməsi nəticəsində.
gücləndirmə : Bir heyvanın və ya insanın gələcək davranışını istiqamətləndirən bəzi nəticələr. Əgər siçovul qolu basarsa və qida qranulunu alırsa, o qida qranulları qolu itələmənin gücləndirilməsinə çevrilir – bu, siçana qolu yenidən basmağı öyrədəcək mükafatdır.
gücləndirici öyrənmə : İstənilən mükafata nail olmaq üçün bir heyvanın və ya insanın müəyyən bir tapşırığı yerinə yetirməyi öyrəndiyi tədrisə yanaşma.
robot : Ətrafını hiss edə bilən, məlumatları emal edən və xüsusi hərəkətlərlə cavab verə bilən maşın. Bəzi robotlar heç bir insan müdaxiləsi olmadan hərəkət edə bilir, digərləri isə insan tərəfindən idarə olunur.
strategiya : çətin və ya çətin bir məqsədə nail olmaq üçün düşünülmüş və ağıllı plan.
sistem : Bəzi funksiyaları yerinə yetirmək üçün birlikdə işləyən hissələr şəbəkəsi. Məsələn, qan, damarlar və ürək insan bədəninin qan dövranı sisteminin əsas komponentləridir. Eynilə, qatarlar, platformalar, yollar, yol siqnalları və yerüstü keçidlər bir ölkənin dəmir yolu sisteminin potensial komponentləri arasındadır. Sistem hətta hansısa metodun bir hissəsi olan proseslərə və ya ideyalara və ya tapşırığı yerinə yetirmək üçün sifarişli prosedurlar toplusuna tətbiq oluna bilər.
alət : Bir insanın və ya başqa bir heyvanın düzəltdiyi və ya əldə etdiyi və sonra qidaya çatmaq, özünü müdafiə etmək və ya baxım kimi bəzi məqsədləri həyata keçirmək üçün istifadə etdiyi bir obyekt.
Sitatlar
Görüş: J. Hong, S. Levine və A. Dragan. Oflayn gücləndirici öyrənmə ilə insan davranışına təsir etməyi öyrənmək . Sinir məlumatlarının emalı sistemlərində irəliləyişlər , 36 . New Orleans, Luiziana. 14 dekabr 2023-cü il