Böyük dil modelləri emosional intellekt testlərini yaratmaqda və həll etməkdə üstündür, araşdırma tapıntıları

Həyatları boyu insanlar başqaları ilə mənalı sosial əlaqələr qura, onlarla empatiya qura və təcrübələrini bölüşə bilərlər. İnsanların həm özlərinin, həm də başqalarının yaşadığı duyğuları idarə etmək, qavramaq və anlamaq qabiliyyəti geniş mənada emosional zəka (EI) adlanır.
Son onilliklər ərzində psixoloqlar EI-ni ölçmək üçün nəzərdə tutulmuş müxtəlif testlər hazırlamışlar, bu testlər adətən insanların gündəlik həyatlarında qarşılaşa biləcəkləri emosiya ilə bağlı problemləri həll etmək qabiliyyətini qiymətləndirirlər. Bu testlər tədqiqat, klinik, peşə və təhsil şəraitlərində istifadə olunan müxtəlif psixoloji qiymətləndirmələrə daxil edilə bilər .
Bern Universiteti və Cenevrə Universitetinin tədqiqatçıları bu yaxınlarda ChatGPT kimi danışıq agentlərinin funksionallığını dəstəkləyən maşın öyrənmə texnikalarının EI testlərini həll etmək və yaratmaq üçün böyük dil modellərinin (LLM) qabiliyyətini qiymətləndirən bir araşdırma apardılar. Communications Psychology jurnalında dərc olunmuş onların nəticələri göstərir ki, LLM-lər bu testləri demək olar ki, insanlar kimi həll edə bilər və gələcək psixometrik EI testlərini inkişaf etdirmək üçün perspektivli vasitələr ola bilər.
“Mən uzun illərdir ki, EI-ni araşdırıram və insanların özlərində və başqalarında duyğuları dəqiq tanımaq, başa düşmək və tənzimləmək qabiliyyətini ölçmək üçün bir neçə performansa əsaslanan testlər hazırlamışam” dedi məqalənin ilk müəllifi Katja Schlegel Medical Xpress-ə.
“ChatGPT və digər böyük dil modelləri geniş şəkildə əlçatan olanda və bir çox həmkarlarım və mən onları işimizdə sınaqdan keçirməyə başlayanda təbii olaraq sual verdim: bu modellər bizim insanlar üçün yaratdığımız EI testlərində necə çıxış edəcək? Eyni zamanda, AI-nin həqiqətən də başqalarını anlamaq, emosiyaya sahib olmaq, emosiyaya sahib olub-olmaması ətrafında canlı elmi müzakirələr gedir.”
EI və empatiya bir-biri ilə sıx əlaqəli iki anlayışdır, çünki hər ikisi başqalarının emosional təcrübələrini anlamaq qabiliyyəti ilə əlaqələndirilir. Schlegel və onun həmkarları Nils R. Sommer və Marcello Mortillaro, LLM-lərin EI testlərində emosiya ilə bağlı problemləri nə dərəcədə həll edə və yarada biləcəyini araşdırmaq üçün yola çıxdılar, çünki bu, həm də onların malik olduqları empatiya səviyyəsinin müəyyən göstəricilərini təqdim edə bilər.
Buna nail olmaq üçün əvvəlcə psixoloji qiymətləndirmələrin bir hissəsi kimi insanlar üçün nəzərdə tutulmuş beş EI testini tamamlamaq üçün altı geniş istifadə olunan LLM-dən xahiş etdilər. Onların sınaqdan keçirdikləri modellərə ChatGPT-4, CHatGPT-o1, Gemini 1.5 flash, Copilot 365, Claude 3.5, Haiku və DeepSeek V3 daxildir.
“İstifadə etdiyimiz EI testləri qısa emosional ssenarilər təqdim edir və birinin nə hiss etdiyini və ya emosional vəziyyəti ən yaxşı şəkildə necə idarə edəcəyini müəyyənləşdirmək kimi ən emosional cəhətdən ağıllı cavab tələb edir” dedi Schlegel. “Sonra biz modellərin xallarını əvvəlki tədqiqatlardakı insan ortalamaları ilə müqayisə etdik.”

Təcrübələrinin ikinci hissəsində tədqiqatçılar ChatGPT-nin ictimaiyyətə təqdim edilən ən son versiyalarından biri olan ChatGPT-4-dən təcrübələrində istifadə olunan EI testlərinin tamamilə yeni versiyalarını yaratmağı xahiş etdilər. Bu testlərə müxtəlif emosional ssenarilər, suallar və cavab variantları daxil edilməlidir, eyni zamanda suallara düzgün cavabların nədən ibarət olduğu müəyyən edilməlidir.
“Sonra biz 460-dan çox insan iştirakçısına həm orijinal, həm də süni intellekt tərəfindən yaradılan testləri verdik. Hər iki versiyanın çətinlik, aydınlıq, reallıq baxımından necə müqayisə edildiyini və onların digər EI testləri və ənənəvi koqnitiv intellekt ölçüsü ilə nə qədər yaxşı əlaqəli olduğunu görmək üçün” dedi Schlegel.
“Bu, bizə yalnız LLM-lərin EI testlərini həll edə bilməyəcəyini yox, həm də etibarlı testlər yaratmaq üçün emosiyalar haqqında kifayət qədər dərindən düşünə bilib-bilmədiklərini yoxlamağa imkan verdi, biz inanırıq ki, bu cür mülahizələrin daha açıq, real dünya şəraitində tətbiqi istiqamətində mühüm addımdır.”
Xüsusilə, Schlegel və onun həmkarları müəyyən etdilər ki, sınaqdan keçirdikləri LLM-lər bütün EI testlərində çox yaxşı çıxış edərək, 81% orta dəqiqliyə nail olub, bu da insan respondentlərin əldə etdiyi orta dəqiqlikdən (56%) yüksəkdir. Onların nəticələri göstərir ki, mövcud LLM-lər insanların müxtəlif kontekstlərdə nə hiss edə biləcəyini daha yaxşı başa düşürlər, ən azı EI testlərində qeyd olunanlar kimi strukturlaşdırılmış vəziyyətlərə gəldikdə.
“Daha da təsir edicisi odur ki, ChatGPT-4 insan iştirakçıları tərəfindən orijinal elementlər kimi eyni dərəcədə aydın və real qiymətləndirilən və müqayisə edilə bilən psixometrik keyfiyyət göstərən tamamilə yeni EI test tapşırıqlarını yarada bildi” dedi Schlegel. “Bizim fikrimizcə, bu cür testləri həm həll etmək, həm də qurmaq bacarığı emosiyaların yüksək konseptual anlayışını əks etdirir”.
Bu son araşdırmanın nəticələri psixoloqları EI testləri və təlim materialları hazırlamaq üçün LLM-lərdən istifadə etməyə təşviq edə bilər ki, bunlar hazırda əl ilə aparılır və kifayət qədər vaxt apara bilər. Bundan əlavə, onlar sosial işçilərin təlimi üçün uyğunlaşdırılmış rol oyunu ssenariləri və digər məzmun yaratmaq üçün LLM-lərin istifadəsinə ilham verə bilər.
“Bizim tapıntılarımız psixi sağlamlıq chatbotları, təhsil müəllimləri və müştəri xidməti avatarları kimi sosial agentlərin inkişafı üçün də aktualdır. Onlar tez-tez insan emosiyalarının başa düşülməsinin vacib olduğu emosional baxımdan həssas kontekstlərdə fəaliyyət göstərir” deyə Schlegel əlavə edib.
“Nəticələrimiz göstərir ki, LLM-lər, ən azı, bu cür qarşılıqlı əlaqə üçün ilkin şərt kimi xidmət edən emosional əsaslandırma bacarıqlarını təqlid edə bilər. Növbəti tədqiqatlarımızda biz LLM-lərin test tapşırıqlarının idarə olunan formatından kənarda daha az strukturlaşdırılmış, real həyatda emosional söhbətlərdə nə qədər yaxşı performans göstərdiyini yoxlamaq niyyətindəyik. Biz həmçinin, onların emosional əsaslı modelləşdirməyə əsaslanaraq, mədəni cəhətdən həssas olduğunu araşdırmaq istəyirik.”
Daha çox məlumat: Katja Schlegel et al, Böyük dil modelləri emosional zəka testlərini həll etmək və yaratmaqda təcrübəlidir, Kommunikasiya Psixologiyası (2025). DOI: 10.1038/s44271-025-00258-x .
Jurnal məlumatı: Ünsiyyət Psixologiyası
© 2025 Science X Network