Tədqiqatçılar süni intellektin etibarlılığını ona sudoku oynamağı öyrətməklə yoxlayırlar

Boulder Kolorado Universiteti tərəfindən
Stefani Baum tərəfindən redaktə edilmişdir , Andrew Zinin tərəfindən nəzərdən keçirilmişdir
Redaktorların qeydləriKredit: Pixabay/CC0 Public Domain
OpenAI-nin ChatGPT və ya Google-un Əkizləri kimi böyük dil modelləri (LLM) adlanan süni intellekt vasitələri bu günlərdə çox şey edə bilər – əlaqələrə dair məsləhətlər vermək, sizi sosial öhdəliklərdən qurtarmaq üçün mətnlər hazırlamaq və hətta elmi məqalələr yazmaq.
Ancaq səhər sudokunu da həll edə bilərlərmi?
Kolorado Boulder Universitetinin kompüter alimləri qrupu yeni bir araşdırmada bunu öyrənməyə qərar verdi. Qrup, oyunçulardan müəyyən qaydalara əməl edərək nömrələri şəbəkəyə daxil etmələrini tələb edən 2300-ə yaxın orijinal sudoku tapmacası yaratdı, sonra onları doldurmaq üçün bir neçə AI alətindən xahiş etdi.
Nəticələr qarışıq bir çanta idi. Bəzi süni intellekt modelləri asan sudokusu həll edə bilsələr də, hətta ən yaxşıları belə onları necə həll etdiklərini izah etməkdə çətinlik çəkdilər – cavablarına necə gəldiklərinə dair səhv, qeyri-dəqiq və hətta sürreal təsvirlər verdilər. Tədqiqatın həmmüəllifi Maria Pacheco bildirib ki, nəticələr süni intellekt tərəfindən yaradılan məlumatların etibarlılığı ilə bağlı suallar yaradır.
Kompüter Elmləri Departamentinin dosenti Pacheco, “Müəyyən növ sudoku bulmacaları üçün, əksər LLM-lər, xüsusən də insanlar üçün hər hansı bir şəkildə istifadə edilə bilən izahatlar hazırlamaqda hələ də çatışmır” dedi. “Niyə bu həll yolu tapdı? Oraya çatmaq üçün hansı addımları atmalısınız?”
O və həmkarları öz nəticələrini Hesablama Dilçilik Assosiasiyasının nəticələrində dərc ediblər .
Tədqiqatçılar tapmacaları aldatmağa çalışmırlar. Bunun əvəzinə, AI platformalarının necə düşündüyünü araşdırmaq üçün bu məntiq məşqlərindən istifadə edirlər. Nəticələr bir gün daha etibarlı və etibarlı kompüter proqramlarına gətirib çıxara bilər, tədqiqatın həmmüəllifi, Elektrik, Kompüter və Enerji Mühəndisliyi Departamentinin professoru Fabio Somenzi bildirib.
“Bulmacalar əyləncəlidir, lakin onlar həm də maşın öyrənməsində qərar qəbuletmə prosesini öyrənmək üçün mikrokosmosdur” dedi. “Əgər sizin vergilərinizi hazırlayan süni intellektə sahibsinizsə, AI-nin nə üçün yazdığını IRS-ə izah etmək istərdiniz.”
Gündəlik tapmaca
Özünü sudoku pərəstişkarı adlandıran Somenzi, tapmacaların çox insan düşüncə tərzinə təsir etdiyini qeyd etdi. Sudoku şəbəkəsini doldurmaq baş sındıranlardan bir sıra məntiqi qaydaları öyrənməyi və onlara əməl etməyi tələb edir. Məsələn, eyni sətirdə və ya sütunda artıq iki varsa, boş kvadrata iki daxil edə bilməzsiniz.
Bu gün LLM-lərin əksəriyyəti bu cür düşüncədə mübarizə aparır, əsasən də necə öyrədildikləri üçün.
Məsələn, ChatGPT qurmaq üçün proqramçılar əvvəlcə internetdə yazılanların demək olar ki, hamısını süni intellektlə qidalandırdılar. ChatGPT suala cavab verəndə bütün bu məlumatlara əsaslanaraq ən çox ehtimal olunan cavabı proqnozlaşdırır – az qala yaddaş yaddaşının kompüter versiyası kimi.
“Onların etdikləri əsasən növbəti sözü proqnozlaşdırmaqdır” dedi Pacheco. “Bir cümləyə başlanğıcınız varsa, ondan sonra hansı söz gəlir? Bunu ingilis dilində əllərinə keçə biləcəkləri hər cümləyə istinad edərək edirlər.”
Pacheco, Somenzi və onların həmkarları kompüter elmində bu iki düşüncə tərzini birləşdirmək üçün artan səylərə qoşuldular – LLM yaddaşını insan beyninin məntiq qabiliyyəti ilə birləşdirərək, “neyrosimvolik” süni intellekt kimi tanınan bir axtarış.
CU Boulder-in keçmiş aspirantları Anirudh Maiya və Razan Alghamdi də yeni məqalənin həmmüəllifləri idilər.
hava necədir?
Başlamaq üçün tədqiqatçılar altı-altılıq şəbəkədən (adətən onlayn tapılan doqquz-doqquz tapmacanın daha sadə versiyası) istifadə edərək müxtəlif çətinlikdə sudoku tapmacaları yaratdılar.
Daha sonra onlar tapmacaları bir sıra AI modellərinə, o cümlədən OpenAI-nin o1 modelinin önizləməsini verdilər – bu, 2023-cü ildə LLM növü üçün ən müasir modeli təmsil edirdi.
o1 modeli sudoku bulmacalarının təxminən 65%-ni düzgün həll edərək paketə rəhbərlik etdi. Sonra komanda AI platformalarından cavablarını necə aldıqlarını izah etmələrini istədi. Nəticələr həqiqətən vəhşi oldu.
Tədqiqatın həmmüəllifi və CU Boulder-in kompüter elmləri üzrə dosenti Ashutosh Trivedi, “Bəzən süni intellektlə bağlı izahatlar faktlar yaradırdı” dedi. “Beləliklə, “Burada iki ola bilməz, çünki eyni cərgədə artıq iki var” deyə bilər, lakin bu belə deyildi.”
Bir nümunə olaraq, tədqiqatçılar süni intellekt alətlərindən biri ilə sudokunun həlli ilə bağlı danışarkən, naməlum səbəblərdən hava proqnozu ilə cavab verdi.
Somenzi, “O zaman AI çılğınlaşdı və tamamilə çaşqın idi” dedi.
Tədqiqatçılar hər şeyi edə biləcək öz süni intellekt sistemini dizayn etməyə ümid edirlər – mürəkkəb tapmacaları həll edən və necə olduğunu izah edən. Onlar sudoku kimi nömrələr şəbəkəsini əhatə edən hitori adlı başqa bir tapmaca növü ilə başlayırlar .
“İnsanlar süni intellektin ortaya çıxan imkanları haqqında danışırlar ki, onlar həll edəcəklərini gözləmədiyiniz şeyləri həll edə bilirlər” dedi Pacheco. “Eyni zamanda, onların bir çox tapşırıqlarda hələ də pis olması təəccüblü deyil”.
Daha çox məlumat: Anirudh Maiya və digərləri, Təbii Dildə Tapmaca Həllərinin İzah edilməsi: 6×6 Sudoku üzrə Kəşfiyyat Araşdırması (2025)Boulderdəki Kolorado Universiteti tərəfindən təmin edilmişdir