Süni intellekt əxlaqının qiymətləndirilməsi üçün yeni yol xəritəsi təklif edildi

Paul Arnold tərəfindən , Phys.org

redaktə edən: Gaby Clark , rəy verən: Robert Egan

Əsas LLM arxitekturası və dəqiq tənzimləmə. Mənbə: Nature (2026). DOI: 10.1038/s41586-025-10021-1

İnsanlar tibbi məsləhət, yoldaşlıq və terapiya üçün onlara müraciət etdikcə, böyük dil modelləri (LLM) getdikcə daha çox mənəvi cəhətdən həssas məlumatlarla məşğul olurlar. Lakin, onlar mənəvi kompaslara sahib olmaları ilə tanınmırlar.

https://d72329b4a9bed2355415fa61242c66c8.safeframe.googlesyndication.com/safeframe/1-0-45/html/container.html

Nature jurnalında dərc olunmuş yeni bir məqalədə Google DeepMind tədqiqatçıları sadəcə insan nümunələrini kopyalamaq əvəzinə, mənəvi səriştəni (əxlaqi prinsiplərə əsaslanaraq qərar qəbul etmək qabiliyyəti) ölçmək üçün yeni bir elmi standart tələb edirlər. Buna nail olmaq üçün tədqiqat müəllifləri süni intellekt çatbotunun həqiqətən etik, yoxsa sadəcə yaxşı aktyor olduğunu bilməyimizə mane olan bir neçə əsas problemi müəyyən edirlər.

Tədqiqatçılar öz məqalələrində yazırdılar ki, “LLM-lərdə mənəvi səriştəliyin ölçülməsinin mühüm əhəmiyyəti var. Birincisi, mənəvi səriştə, ehtimal ki, miqyasda etibarlı mənəvi performans üçün ən yaxşı dəlildir və süni intellekt sistemlərinin təhlükəsiz yerləşdirilməsi üçün əsas dəlillər də belədir.”

Mövcud qiymətləndirmələr əxlaqi göstəricilərə əsaslanır, bu da sadəcə modelin düzgün cavab vermək qabiliyyətidir. Lakin bu, onun əsas mühakimə prosesi və ya müəyyən bir vəziyyətin mənəvi çəkisini başa düşüb-düşməməsi barədə heç nə aşkar etmir.

Üç əsas çətinlik

Məqalədə süni intellekt əxlaqını qiymətləndirməyi çətinləşdirən üç əsas problem müəyyən edilir. Birincisi, faksimile problemidir, burada LLM-lər sadəcə əsas məntiq olmadan əxlaqi mühakimənin surətini çıxara bilərlər. Həmçinin, əxlaq olduqca mürəkkəbdir , burada tək bir qərar ədalət, xərc, dürüstlük və sosial etiket kimi birdən çox amilin balanslaşdırılmasını tələb edə bilər. Süni intellekt tez-tez bu kimi amillər ziddiyyət təşkil etdikdə və ya üst-üstə düşdükdə çətinlik çəkir.

Üçüncü əsas çətinlik, vahid qəti düzgün cavabın olmamasıdır. Müxtəlif mədəniyyətlərin, ölkələrin və peşələrin fərqli əxlaqi qaydaları ola bilər.

Əxlaq yol xəritəsi

Bu çətinliklərə görə, məqalədə süni intellekt əxlaqını sınaqdan keçirmək üçün üç fərqli metodu əhatə edən yeni bir yol xəritəsi təklif olunur. Bunlardan biri LLM-lərə təlim məlumatlarında görünməsi ehtimalı az olan ssenarilər təqdim etməkdir. Bu, tədqiqatçılara məntiqi tətbiq edib-etmədiyini və ya əzbərlədiyi nümunələrə əsaslandığını görməyə imkan verəcəkdir.

Süni intellekt həmçinin hər dəfə insanın yaşı və ya səhvin dəyəri kimi kiçik bir detalın dəyişdirildiyi fərqli mənəvi ssenarilərlə təqdim edilməlidir . Məqsəd, süni intellektin həqiqətən vacib olanı anlayıb-anlamadığını görməkdir. Süni intellektini qiymətləndirməyin başqa bir yolu, onun sadəcə universal bir həqiqəti təqdim etmək əvəzinə, müəyyən bir mədəni və ya peşəkar çərçivəyə uyğunlaşa biləcəyini görməkdir.

Nəticə etibarilə, tədqiqatın müəllifləri inanırlar ki, süni intellektdən təhlükəsiz istifadə etmək üçün mənəvi səriştəni ölçmək vacibdir. Bunu etmək, bizim adımızdan vacib qərarlar qəbul edərkən bu sistemlərə etibar edilə biləcəyini təmin edəcək.

Müəllifimiz Paul Arnold tərəfindən sizin üçün yazılmış, Qeb Klark tərəfindən redaktə edilmiş və Robert Eqan tərəfindən faktlar yoxlanılmış və nəzərdən keçirilmiş bu məqalə diqqətli insan əməyinin nəticəsidir. Müstəqil elmi jurnalistikanı yaşatmaq üçün sizin kimi oxuculara güvənirik. Bu reportaj sizin üçün vacibdirsə, xahiş edirik ianə etməyi düşünün (xüsusilə aylıq). Təşəkkür olaraq reklamsız hesab əldə edəcəksiniz .

Nəşr detalları

Julia Haas və digərləri, Böyük dil modellərində mənəvi səriştənin qiymətləndirilməsi üçün yol xəritəsi, Nature (2026). DOI: 10.1038/s41586-025-10021-1

Jurnal məlumatı: Təbiət

Əsas anlayışlar

Böyük dil modelləri

BE	ÇA	Ç	CA	C	Ş	B
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30

Pozitivlikdən qaynaqlanan cazibə qüvvəsi:...

Attosaniyədə zaman şkalasında tutulan...

Bir protein hər iki...

Bu kiçik orqanizm sadəcə...

Vera C. Rubin Rəsədxanasının...

Artemis II Günəş hissəcikləri...