#Xəbərlər

Komanda LLM-lərin etibarlılığını və izlənməsini təkmilləşdirməyə yönəlmiş əsaslandırma çərçivəsini təklif edir

Çin texnologiya şirkəti Baidu Inc.-də süni intellekt üzrə tədqiqatçılar qrupu LLM-lərin etibarlılığını və izlənilməsini yaxşılaşdırmaq üçün nəzərdə tutulmuş yeni əsaslandırma çərçivəsi təklif edir. Qrup arXiv preprint serverində öz ideyalarını təsvir edən məqalə dərc edib .

Son bir neçə il ərzində ChatGPT kimi LLM-lər əsas tətbiqlərə çevrildi, istifadəçilər sənədlər yazmaq , şəkillər yaratmaq və hətta mahnı yazmaq imkanlarından istifadə edirlər .

Lakin LLM-lərin bir gözə çarpan zəif tərəfi hələ də qalır – onların öz nəticələrini yoxlaya bilməmələri, vaxtaşırı istifadəçilərə heç bir mənası olmayan “halüsinasiyalar” təqdim etmədiklərinə əmin olmaqdır. Bu zəiflik süni intellekt tətbiqlərinin məlumatların bütövlüyünə əsaslanan daha kritik tətbiqlər üçün istifadə edilməsinə mane olur .

Bu yeni səydə, Baidu komandası, LLM-ləri son istifadəçilərə nəticələri təqdim etməzdən əvvəl işlərini yoxlamağa məcbur etmək məqsədi daşıyan bir strategiya hazırladı.

Yeni yanaşma, nəticələrin təqdim edilməsindən dərhal əvvəl LLM mühərrikinə üç addımlı prosesin əlavə edilməsini nəzərdə tutur. Birincisi, nəticələri qiymətləndirmək və onları istifadəçi sorğusuna uyğunluğu üzrə mühakimə etmək üçün uyğunluqdan xəbərdar bir model əlavə etməkdir. İkincisi, sitat üçün müvafiq sənədlərin seçildiyi və cavabın düzgünlüyünün sübutu kimi çıxarışların təqdim olunduğu sübuta əsaslanan seçmə variantı əhatə edir. Üçüncüsü, əvvəlki iki modulun nəticələrinə əsasən aydın və qısa təhlil aparan trayektoriya təhlili modulunu əhatə edir. Daha sonra istifadəçiyə son cavabı təqdim edir.

Tədqiqat qrupu bu yanaşmanın LLM-ləri istifadəçilərə verilən cavablardan daha çox məlumatlı olmağa məcbur edəcəyini və nəticədə dəqiqliyi artıracağını təklif edir. Komanda həmçinin LLM-lərə test modulları əlavə edərək və sonra göstərişlər yazmaqla öz fikirlərini sınaqdan keçirib. Onlar iddia edirlər ki, təkmilləşdirilmiş LLM-lər daha kiçik təlim verilənlər bazalarından istifadə edərək GPT-4-dən üstün ola biliblər.

Tədqiqatçılar təklif edirlər ki, onların kimi çərçivələr daha etibarlı LLM-lərə gətirib çıxara bilər ki, bu da onları daha çox tətbiq üçün uyğun edə bilər. Onlar həmçinin hazırda kütləvi məşq məlumat dəstlərinə çıxışı olmayan daha çox oyunçuya meydan açacaqlarını təklif edirlər.

Ətraflı məlumat: Yuan Xia və başqaları, Öz-özünə düşünmə ilə Axtarış Genişləndirilmiş Dil Modelinin Təkmilləşdirilməsi, arXiv (2024). DOI: 10.48550/arxiv.2407.19813

Jurnal məlumatı: arXiv