Süni intellekt agentləri riyazi düşüncənin təkmilləşdirilməsi yollarını müzakirə edirlər

İnqrid Fadelli , Phys.org tərəfindən

redaktə edən: Gaby Clark , rəy verən: Robert Egan

Redaktorların qeydləriKomandanın A-HMAD çərçivəsinin Ailə Sistemi arxitekturası. Müəllif: Yan Zhou və Yanguang Chen.

Müxtəlif dillərdə mətnləri emal edə və yarada bilən böyük dil modelləri (LLM), süni intellekt (AI) sistemləri hazırda dünyada yazılı məzmun, mənbə məlumatları yaratmaq və hətta veb saytları və ya tətbiqləri kodlaşdırmaq üçün geniş istifadə olunur. Bu modellər son bir neçə ildə əhəmiyyətli dərəcədə təkmilləşsə də, onların cavablarında bəzən faktiki qeyri-dəqiqliklər və ya məntiqi uyğunsuzluqlar ola bilər.

Başqa sözlə, bəzi hallarda LLM-lər istifadəçilərin suallarına etibarlı görünən cavablar verir, lakin onlarda yalan məlumatlar, ziddiyyətli ifadələr və ya məntiqi uyğunsuzluqlar olur. Müşahidə olunan bu tendensiya onları etibarsız edir və xüsusilə təhsil və peşə mühitlərində dəqiq məlumat əldə etmək və ya sənədlər hazırlamaq potensiallarını məhdudlaşdırır.

Cənubi Çin Kənd Təsərrüfatı Universiteti və Şanxay Maliyyə və İqtisadiyyat Universitetinin tədqiqatçıları bu yaxınlarda LLM-lərin riyazi düşünmə qabiliyyətlərini və etibarlılığını artırdığı aşkar edilmiş yeni bir çərçivə təqdim etdilər. Kral Səud Universitetinin Kompüter və İnformasiya Elmləri Jurnalında təqdim edilən yeni çərçivə, verilən suala verməli olduqları cavab barədə konsensusa gəlməyə çalışan birdən çox LLM arasında müzakirələrə başlamaqla işləyir.

Yan Zhou və Yanguang Chen öz məqalələrində yazırdılar ki, “Əvvəlki işlər, tez-tez istifadə edilən üsullardan (məsələn, düşüncə zəncirinə əsaslanan istək və özünəinam) və post-hoc özünütəmizləmədən istifadə edərək LLM performansını yaxşılaşdırmışdır, lakin bunlar adətən tək bir model nümunəsində işləyir”.

“Son zamanlar çoxagentli debat çərçivələri tamamlayıcı bir yanaşma kimi ortaya çıxmışdır ki, burada birdən çox LLM agenti cavablar təklif edir və konsensusa çatmaq üçün bir-birinin mülahizələrini tənqid edir. Belə bir “ağıl cəmiyyəti” yanaşmasının riyazi mülahizələri əhəmiyyətli dərəcədə yaxşılaşdırdığı və faktiki halüsinasiyaları azaltdığı göstərilmişdir. Lakin mövcud debat metodları sadə səs çoxluğu ilə homogen agentlərdən istifadə edir və bu da onların effektivliyini məhdudlaşdırır.”

Çoxagentli debatlar vasitəsilə LLM mühakiməsinin gücləndirilməsi

LLM-lər tərəfindən verilən cavablardakı faktiki və məntiqi qüsurları azaltmaq üçün komanda Adaptiv Heterogen Çox Agentli Debat (A-HMAD) adlı bir çərçivə hazırladı. Əsasən, bu, müxtəlif ixtisaslara malik birdən çox süni intellekt agenti arasında debatlara səbəb olmağı, onların müzakirəsini dinamik şəkildə modulyasiya etməyi və müəyyən bir mövzuda konsensusa gəlmələrini təklif edir.

Zhou və Chen yazırdılar ki, “A-HMAD-dakı hər bir agentə fərqli bir rol və ya təcrübə (məsələn, məntiqi mühakimə, faktların yoxlanılması, strateji planlaşdırma) təyin edilir ki, bu da eyni agentlərə nisbətən daha əhatəli səhv yoxlamasına və perspektiv müxtəlifliyinə imkan verir. Koordinasiya siyasəti sualın sahəsinə və inkişaf edən debat vəziyyətinə əsasən hər mərhələdə hansı agentlərin töhfə verəcəyini dinamik şəkildə seçir.”

Müxtəlif LLM-lərin irəli sürdüyü arqumentləri ölçmək və sorğuya ən dəqiq və məntiqi cəhətdən əsaslandırılmış cavab vermələrini təmin etmək üçün komanda konsensus optimizatoru hazırladı. Bu, hər bir agentin töhfəsini onların etibarlılığına və daxil etdikləri məlumatlara ümumi etibarına əsasən qiymətləndirən bir vasitədir.

İlkin nəticələr və mümkün gələcək tətbiqlər

Zhou və Chen təklif etdikləri çərçivəni həm süni intellekt modelləri, həm də bəzi insanlar üçün çətin olan altı fərqli problem növündən istifadə edərək sınaqdan keçirdilər. Bundan əlavə, onlar bu dəyişikliklərin onun fəaliyyətinə necə təsir etdiyini qiymətləndirmək üçün çərçivənin bəzi əsas komponentlərini çıxardıqları və ya dəyişdirdikləri sınaqlar apardılar.

Zhou və Chen yazırdılar ki, “Arifmetik QA, ibtidai məktəb riyaziyyatı (GSM8K), çoxfaktlı sual-cavab (MMLU), faktiki tərcümeyi-hal yaratmaq və şahmat strategiyası da daxil olmaqla altı çətin meyar üzrə A-HMAD-ımız əvvəlki tək model metodlarını və orijinal çoxagentli debat bazasını ardıcıl olaraq üstələyir”.

“Qeyd edək ki, A-HMAD bu tapşırıqlar üzrə standart debatlara nisbətən 4-6% mütləq dəqiqlik artımına nail olur və tərcümeyi-hal faktlarında faktiki səhvləri 30%-dən çox azaldır. Biz agent heterojenliyinin, əlavə debat raundlarının və öyrənilmiş konsensus modulunun faydalarını nümayiş etdirən geniş ablasyonlar təqdim edirik.”

İlkin sınaqlarda komandanın çərçivəsinin müqayisə edilən fərdi LLM-lərə və alternativ debat əsaslı yanaşmalara nisbətən daha faktiki cəhətdən dəqiq və məntiqi cəhətdən əsaslı cavablar verdiyi aşkar edilmişdir. Gələcəkdə çərçivə daha da təkmilləşdirilə və müəllimlər, professorlar, elm adamları və digər mütəxəssislər tərəfindən mürəkkəb suallara tez bir zamanda düzgün cavablar tapmaq üçün istifadə edilə bilən daha etibarlı süni intellekt platforması hazırlamaq üçün istifadə edilə bilər.

“Tapıntılarımız göstərir ki, adaptiv, rol müxtəlifliyi ilə seçilən müzakirə ansamblı LLM əsaslı təhsil düşüncəsində əhəmiyyətli irəliləyişlərə səbəb ola bilər və daha təhlükəsiz, daha interpretasiya edilə bilən və pedaqoji cəhətdən etibarlı süni intellekt sistemləri üçün yol aça bilər”, – deyə müəlliflər yekunlaşdırıblar.

Müəllifimiz İnqrid Fadelli tərəfindən sizin üçün yazılmış, Qeb Klark tərəfindən redaktə edilmiş və Robert İqan tərəfindən faktlar yoxlanılmış və nəzərdən keçirilmiş bu məqalə diqqətli insan əməyinin nəticəsidir. Müstəqil elmi jurnalistikanı yaşatmaq üçün sizin kimi oxuculara güvənirik. Əgər bu reportaj sizin üçün vacibdirsə, xahiş edirik ianə etməyi (xüsusilə aylıq) nəzərdən keçirin. Təşəkkür olaraq reklamsız hesab əldə edəcəksiniz .

Əlavə məlumat: Yan Zhou və digərləri, Böyük dil modellərində təkmilləşdirilmiş təhsil və faktiki mühakimə üçün adaptiv heterojen çoxagentli debat, Kral Səud Universitetinin Kompüter və İnformasiya Elmləri Jurnalı (2025). DOI: 10.1007/s44443-025-00353-3 .

BE	ÇA	Ç	CA	C	Ş	B
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30

Artemis II kosmik gəmisinin...

Sadə bir EKQ testi...

Daha səmərəli orbitron cihazlara...

Artemis astronavtları Aya yarıdan...

Real mühitlərdə “kvant çökməsinin”...

Two şirkəti: Alimlər ulduz...