#Robototexnika və AI #Xəbərlər

Delphi təcrübəsi süni intellekt agentini əxlaqi mühakimə ilə təchiz etməyə çalışır

Qabaqcıl süni intellekt (AI) alətləri, o cümlədən ChatGPT kimi LLM əsaslı danışıq agentləri getdikcə geniş yayılmışdır. Bu alətlər indi bütün dünyada saysız-hesabsız insanlar tərəfindən həm peşəkar, həm də şəxsi məqsədlər üçün istifadə olunur.

Bəzi istifadəçilər indi də süni intellekt agentlərindən bəzilərinin etik və əxlaqi nüanslara malik ola biləcək gündəlik suallara cavab vermələrini xahiş edirlər. Bu agentlərə ümumiyyətlə “doğru” və “yanlış” hesab edilənləri ayırd etmək qabiliyyətinin təmin edilməsi, beləliklə, onlar yalnız etik və əxlaqi cəhətdən əsaslandırılmış cavablar vermək üçün proqramlaşdırıla bilsinlər, buna görə də son dərəcə vacibdir.

Vaşinqton Universitetinin, Allen Süni İntellekt İnstitutunun və ABŞ-ın digər institutlarının tədqiqatçıları bu yaxınlarda süni intellekt agentlərini insanın əxlaqi mühakimələrinə bərabər maşınla təchiz etmək imkanlarını araşdıran bir təcrübə keçirdilər.

Nature Machine Intelligence – də nəşr olunan məqalədə onlar Delphi adlı yeni hesablama modelini təqdim edirlər ki, bu model maşın əsaslı əxlaqın güclü və məhdudiyyətlərini araşdırmaq üçün istifadə olunurdu.

“Cəmiyyət geniş istifadə üçün getdikcə daha güclü süni intellekt sistemlərini qəbul etdikcə, maşın əxlaqı və ya onun olmaması ilə bağlı narahatlıqlar artır” deyə məqalənin ilk müəllifi Liwei Jiang Tech Xplore-a bildirib.

“Milyonlarla istifadəçi artıq qərar yardımı kimi chatbotlar kimi süni intellekt sistemlərinin nəticələrinə etibar edir. Bu arada, süni intellekt üzrə tədqiqatçılar bu sistemləri insan əxlaqı və dəyərlərinə uyğunlaşdırmaq problemi ilə mübarizə aparmağa davam edirlər. İnsan əxlaqını maşınlarla tam şəkildə yaxınlaşdırmaq nəhəng bir nəticə verir. problem, çünki bəşəriyyət əsrlər boyu insan əxlaqı ilə bağlı nəticələrlə kifayətlənməyib və çox güman ki, heç vaxt nail ola bilməyəcək. konsensus”.

https://googleads.g.doubleclick.net/pagead/ads?client=ca-pub-0536483524803400&output=html&h=188&slotname=2793866484&adk=1121470953&adf=746485419&pi=t.ma~as.2793866484&w=750&abgtt=6&fwrn=4&lmt=1738311574&rafmt=11&format=750×188&url=https%3A%2F%2Ftechxplore.com%2Fnews%2F2025-01-delphi-equip-ai-agent-moral.html&wgl=1&uach=WyJXaW5kb3dzIiwiMTkuMC4wIiwieDg2IiwiIiwiMTMyLjAuNjgzNC4xNjAiLG51bGwsMCxudWxsLCI2NCIsW1siTm90IEEoQnJhbmQiLCI4LjAuMC4wIl0sWyJDaHJvbWl1bSIsIjEzMi4wLjY4MzQuMTYwIl0sWyJHb29nbGUgQ2hyb21lIiwiMTMyLjAuNjgzNC4xNjAiXV0sMF0.&dt=1738311574157&bpp=1&bdt=305&idt=264&shv=r20250129&mjsv=m202501270101&ptt=9&saldr=aa&abxe=1&cookie=ID%3Dfdc40d724f2dca57%3AT%3D1735367325%3ART%3D1738213932%3AS%3DALNI_MYStQ6fUQQQLyo5Z7z1h-XhXcWBtA&gpic=UID%3D00000f80eacffadc%3AT%3D1735367325%3ART%3D1738213932%3AS%3DALNI_MYaOugky0UawScoidzfbXof3-N-iw&eo_id_str=ID%3De43bb863646b60b8%3AT%3D1735367325%3ART%3D1738213932%3AS%3DAA-AfjbQoPwZqH28q9IwcCLRSzzg&prev_fmts=0x0&nras=1&correlator=7913790711047&frm=20&pv=1&rplot=4&u_tz=240&u_his=1&u_h=1080&u_w=1920&u_ah=1032&u_aw=1920&u_cd=24&u_sd=1&dmc=8&adx=447&ady=1709&biw=1903&bih=945&scr_x=0&scr_y=0&eid=31089715%2C31090068%2C31090066%2C95347433&oid=2&pvsid=633893263352595&tmod=84239033&uas=0&nvt=1&ref=https%3A%2F%2Fphys.org%2F&fc=1920&brdim=0%2C0%2C0%2C0%2C1920%2C0%2C1920%2C1032%2C1920%2C945&vis=1&rsz=%7C%7CpeEbr%7C&abl=CS&pfx=0&fu=128&bc=31&bz=1&td=1&tdf=2&psd=W251bGwsbnVsbCxudWxsLDNd&nt=1&ifi=2&uci=a!2&btvi=1&fsb=1&dtd=269

Jiang və onun həmkarlarının son işinin əsas məqsədi insan əxlaqi dəyərlərini maşınlara aşılamaqla bağlı imkanları və problemləri araşdırmaq idi. Bu, süni intellekt agentinə insanların əxlaqi mühakimələrini təxmin etməyi öyrətmək məqsədi daşıyan tədqiqat işi olan Delphi layihəsinin yaradılmasına gətirib çıxardı.

“Bizim inkişaf etdirdiyimiz Delphi modeli nüanslı və mürəkkəb vəziyyətlər üzərində hədəf üzrə proqnozlar yaratmaq üçün nəzərəçarpacaq qabiliyyət nümayiş etdirir və aşağıdan yuxarı yanaşmaların perspektivli təsirini təklif edir” dedi Jiang.

“Ancaq biz Delfinin geniş yayılmış qərəzlər kimi səhvlərə qarşı həssaslığını da müşahidə etdik. Con Roulsun təklif etdiyi kimi, bu cür qərəzlilikləri “hər iki tərəfdən işləyən” hibrid yanaşma – alt tərəfi tamamlamaq üçün yuxarıdan aşağı məhdudiyyətlər tətbiq etməklə aradan qaldırmaq olar. – bilik.”

Delphi layihəsinin daha geniş missiyası daha inklüziv, etik cəhətdən məlumatlı və sosial cəhətdən məlumatlı AI sistemlərini inkişaf etdirməyə yönəlmiş çoxsahəli tədqiqatlar aparmaq üçün daha çox tədqiqat qrupunu ruhlandırmaqdır. Bunun üçün Jiang və onun həmkarları müxtəlif gündəlik vəziyyətlərdə insanların əxlaqi mühakimələrini proqnozlaşdırmaq üçün öyrədilmiş hesablama modeli olan Delphi-ni inkişaf etdirdilər.

“Delphi, gündəlik vəziyyətlərə dair 1,7 milyon təsviri insan əxlaqi mühakimələrinin toplusu olan Commonsense Norm Bank (Norm Bank) üzrə təhsil alır” dedi Jiang. “Delphi-nin əsası Unicorndur, bir sıra ümumi mənalı QA meyarları üzrə öyrədilmiş çox vəzifəli sağlam düşüncə modelidir.”

Əxlaqi mühakimələr dünyanın necə işlədiyi və nəyin məqbul sayıldığı və ya qəbul edilmədiyi barədə sağlam düşüncədə dərin köklərə malikdir. Beləliklə, tədqiqatçılar modeli ən müasir universal sağlam düşüncə modeli olan Unicorn-un altında yatan koddan istifadə edərək yaratmağa qərar verdilər.

“Məsələn, bir uşaqdan sikkə ilə elektrik rozetkasına toxunmağı xahiş etməyin icazəli olub-olmadığını mühakimə etmək, canlı naqillərə toxunmağın təhlükələri haqqında fiziki sağlam düşüncə biliklərini tələb edir” dedi Jiang. “Unicorn modeli Google-un T5-11B (yəni, 11 milyard parametrli T5 modeli) transformator arxitekturasına əsaslanan əvvəlcədən öyrədilmiş neyron dili modelinə əsaslanaraq bu cür problemlərə yaxınlaşır.”

Delphi təcrübəsi süni intellekt agentini əxlaqi mühakimə ilə təchiz etməyə çalışır
Delphi, Norm Bankından kənarda görünməmiş vəziyyətləri ümumiləşdirmək və dəyişən kontekstlərə qarşı öz mühakiməsini tənzimləmək üçün güclü bacarıq nümayiş etdirir. Etiketlərin rəngləri Delphi-nin təsnifat nəticələrini göstərir (yaşıl, müsbət; boz, neytral; qırmızı, mənfi). Mətn etiketləri Delphi-nin açıq mətn cavablarından gəlir. Kredit: Nature Machine Intelligence (2025). DOI: 10.1038/s42256-024-00969-6.

Delphi modelinin interfeysi ChatGPT və digər danışıq agentlərinin interfeysinə bənzəyir . İstifadəçilər sadəcə bir sorğu yazır və model onu emal edəcək və cavab verəcəkdir. Bu sorğu bəyanat (məsələn, “Qadınlar alim ola bilməz”), gündəlik vəziyyətin təsviri (məsələn, “Dostunu hava limanına aparmaq”) və ya konkret vəziyyətin mənəvi nəticələri ilə bağlı sual (məsələn, “Mən bir dostumu hava limanına lisenziyasız apara bilərəmmi?”).

“İstifadəçinin sorğusuna cavab olaraq, Delphi sadə bəli/xeyr cavabı (məsələn, “Xeyr, qadınlar alim ola bilər”) və ya sərbəst formada cavab verir ki, bu da mənəvi mühakimələrin daha zəngin nüanslarını tutmaq üçün nəzərdə tutulub”, – Jiang izah edib.

https://googleads.g.doubleclick.net/pagead/ads?client=ca-pub-0536483524803400&output=html&h=188&slotname=2793866484&adk=1121470953&adf=1041534309&pi=t.ma~as.2793866484&w=750&abgtt=6&fwrn=4&lmt=1738311574&rafmt=11&format=750×188&url=https%3A%2F%2Ftechxplore.com%2Fnews%2F2025-01-delphi-equip-ai-agent-moral.html&wgl=1&uach=WyJXaW5kb3dzIiwiMTkuMC4wIiwieDg2IiwiIiwiMTMyLjAuNjgzNC4xNjAiLG51bGwsMCxudWxsLCI2NCIsW1siTm90IEEoQnJhbmQiLCI4LjAuMC4wIl0sWyJDaHJvbWl1bSIsIjEzMi4wLjY4MzQuMTYwIl0sWyJHb29nbGUgQ2hyb21lIiwiMTMyLjAuNjgzNC4xNjAiXV0sMF0.&dt=1738311574158&bpp=1&bdt=306&idt=280&shv=r20250129&mjsv=m202501270101&ptt=9&saldr=aa&abxe=1&cookie=ID%3Dfdc40d724f2dca57%3AT%3D1735367325%3ART%3D1738213932%3AS%3DALNI_MYStQ6fUQQQLyo5Z7z1h-XhXcWBtA&gpic=UID%3D00000f80eacffadc%3AT%3D1735367325%3ART%3D1738213932%3AS%3DALNI_MYaOugky0UawScoidzfbXof3-N-iw&eo_id_str=ID%3De43bb863646b60b8%3AT%3D1735367325%3ART%3D1738213932%3AS%3DAA-AfjbQoPwZqH28q9IwcCLRSzzg&prev_fmts=0x0%2C750x188&nras=1&correlator=7913790711047&frm=20&pv=1&rplot=4&u_tz=240&u_his=1&u_h=1080&u_w=1920&u_ah=1032&u_aw=1920&u_cd=24&u_sd=1&dmc=8&adx=447&ady=3162&biw=1903&bih=945&scr_x=0&scr_y=0&eid=31089715%2C31090068%2C31090066%2C95347433&oid=2&pvsid=633893263352595&tmod=84239033&uas=0&nvt=1&ref=https%3A%2F%2Fphys.org%2F&fc=1920&brdim=0%2C0%2C0%2C0%2C1920%2C0%2C1920%2C1032%2C1920%2C945&vis=1&rsz=%7C%7CpeEbr%7C&abl=CS&pfx=0&fu=128&bc=31&bz=1&td=1&tdf=2&psd=W251bGwsbnVsbCxudWxsLDNd&nt=1&ifi=3&uci=a!3&btvi=2&fsb=1&dtd=283

“Məsələn, “dostunuzu vəsiqənizi gətirmədən hava limanına aparmaq” sualına Delphi “məsuliyyətsizlikdir” deyə cavab verir, “Səhər dostunuzu hava limanına apara bilərsinizmi?” sualına isə “məsuliyyətsizlikdir”. Delfi cavab verir: ‘diqqətlidir’.”

Jiang və onun həmkarları Delfiyə çoxlu sayda sorğular verməklə və onun verdiyi cavabları müşahidə etməklə onun mənəvi mühakiməsini qiymətləndirdilər. Maraqlıdır ki, onlar modelin ümumilikdə insan əxlaqi dəyərlərini əks etdirən, müxtəlif vəziyyətlər və ssenarilər üzrə yaxşı ümumiləşdirən cavablar verə bildiyini tapdılar.

“Delphi layihəsinin mənə verdiyi ən diqqətəlayiq töhfə, maşınlara insan əxlaqının öyrədilməsi ilə bağlı bu ilk əhəmiyyətli empirik tədqiqat vasitəsilə biz maşın əxlaqı sahəsində tədqiqat sahələrində əhəmiyyətli təqib işlərinə səbəb olduq” dedi Jiang. “Biz sosial cəhətdən məsuliyyətli AI-nin, xüsusən də qlobal istifadəçilərin həyatına nüfuz edən AI tətbiqlərinin yaradılmasında irəliləyişin asanlaşdırılmasını çox qiymətləndiririk.”

Delphi ictimaiyyətə təqdim edildi və o vaxtdan bəri tədqiqatçılar tərəfindən müxtəlif şəraitlərdə AI agentlərinin əxlaqi mülahizələrini təkmilləşdirmək və ya sınaqdan keçirmək üçün istifadə edilmişdir. Məsələn, bir araşdırma onun mətnə ​​əsaslanan oyun mühitində zərərli hərəkətlərdən qaçmaq qabiliyyətini , digəri isə onun dialoq agentlərinin təhlükəsizliyini artırmaq potensialını araşdırıb , Jiang-ın tədqiqat qrupunun digər işləri isə onun nifrət nitqini aşkar etmək və etik cəhətdən formalaşdırmaq qabiliyyətini qiymətləndirib. -məlumatlı mətnlər.

“Qeyd etmək vacibdir ki, Delphi hələ də tədqiqat prototipidir və əlbəttə ki, gündəlik insan etik qərarların qəbulu üçün nüfuzlu bələdçi kimi xidmət etməyə hazır deyil” dedi Jiang.

“Bu, etik sahədə insan-maşın əməkdaşlığının imkanlarını və hüdudlarını araşdırmaq üçün nəzərdə tutulmuş bir təcrübədir. Təkmilləşdirilmiş varis texnologiyanın bir gün insanlara birbaşa etik məsləhətlər verə biləcəyinin olub-olmaması nəzəriyyəçilər və bütövlükdə cəmiyyət tərəfindən müzakirə ediləcək bir mövzudur.”

Delphi layihəsi süni intellekt agentlərinin gələcək inkişafına ilham verə biləcək maraqlı nəticələr verdi. Jiang və onun həmkarları ümid edirlər ki, onların səyləri dünya üzrə digər tədqiqatçıları da hesablama modellərinin əxlaqi mühakimə və etik əsaslandırma imkanlarını təkmilləşdirmək istiqamətində işləməyə təşviq edəcək.

“İnsan əxlaqının əsas problemlərindən biri onun nə monolit, nə də statik olmamasıdır” dedi Jiang.

“Cəmiyyətlər normalarda fərqləndikcə və zaman keçdikcə inkişaf etdikcə, möhkəm AI sistemi bu dəyər relativizminə və plüralizminə həssas olmalıdır. Biz zənginləşdirmə probleminin həllinə həsr olunmuş ” plüralistik dəyərlərin uyğunlaşdırılması ” mövzusunda zəngin, əsas inkişaf edən AI tədqiqat xəttinə başlamışıq. AI sistemlərində dəyər təmsillərinin müxtəlifliyi.”

Delphi layihəsi haqqında məqalə dərc edildikdən sonra, Jiang və onun həmkarları AI modellərinin mədəni qeyri-adekvatlığını aşkar etmək üçün qiymətləndirmə məlumat dəstləri və ya üsulların qurulmasına yönəlmiş başqa bir araşdırma apardılar. Onların gələcək tədqiqatları süni intellekt agentlərinin inkişafı və təkmilləşdirilməsinə daha da töhfə verə biləcək yeni fikirlər toplaya bilər.

“Dünyada müxtəlif əhali üçün AI təmsilçiliyini zənginləşdirmək açıq, həll edilməmiş, müstəqil böyük problemdir və biz bu məqsədə yaxınlaşmaq üzərində fəal işləyirik” dedi Jiang.

Daha çox məlumat: Liwei Jiang et al, Delphi təcrübəsi vasitəsilə maşının əxlaqi mühakiməsinin araşdırılması, Təbiət Maşın Zəka (2025). DOI: 10.1038/s42256-024-00969-6 .

Yu Ying Chiu və başqaları, CulturalBench: LLM-lərin Mədəni Biliklərinin (Yoxluğunun) Ölçülməsi üzrə Sağlam, Müxtəlif və Çətin Qalıcı Meyar, arXiv (2024). DOI: 10.48550/arxiv.2410.02677

Jurnal məlumatı: Nature Machine Intelligence , arXiv

  

© 2025 Science X Network

Leave a comment

Sizin e-poçt ünvanınız dərc edilməyəcəkdir. Gərəkli sahələr * ilə işarələnmişdir