Aparıcı süni intellekt modelləri orijinal riyazi məsələləri həll etməkdə çətinlik çəkirlərPaul Arnold tərəfindən , Phys.org
redaktə edən: Gaby Clark , rəy verən: Robert Egan
Redaktorların qeydləri
GIST
Tercih edilən mənbə kimi əlavə edin
Kredit: Unsplash/CC0 İctimai Sahə
Riyaziyyat, bir çox digər elmi işlər kimi, getdikcə daha çox süni intellektdən istifadə edir. Əlbəttə ki, riyaziyyat süni intellektin əsasını təşkil edir, lakin riyaziyyatçılar ədəbiyyat axtarışı və əlyazmaların səhvlərə görə yoxlanılması kimi tapşırıqlar üçün də bu vasitələrə müraciət edirlər. Bəs süni intellekt orijinal, yüksək səviyyəli tədqiqat problemlərinin həllində nə dərəcədə yaxşı nəticə göstərə bilər?
Bu günə qədər süni intellektin bu səviyyədə riyaziyyatı həll etmək imkanlarını qiymətləndirmək üçün geniş qəbul edilmiş real metodologiya mövcud deyil. Buna görə də bir qrup riyaziyyatçı arXiv preprint serverində mövcud olan bir araşdırmada ətraflı şəkildə izah etdikləri kimi , maşınları sınaqdan keçirmək qərarına gəldilər .
Süni intellekt sınağı ilə bağlı əvvəlki cəhdlərdə dərsliklərdə artıq tapılan riyaziyyat yarışma məsələləri və sualları istifadə edilmişdir. Bu tədqiqatı fərqli edən odur ki, proqramların qarşılaşdığı suallar riyaziyyatçıların öz tədqiqatlarından götürülmüşdür. Onlar heç vaxt internetdə yerləşdirilməmiş və ya dərc edilməmişdi, bu da o deməkdir ki, süni intellekt təlim məlumatlarından cavabları əzbərləyə bilmirdi.
Maşınların sınaqdan keçirilməsi
Tədqiqatda iştirak edən hər bir riyaziyyatçı özünəməxsus bir problem təqdim etdi və sualların qeyri-mümkün olmadığını sübut etmək üçün əvvəlcə onu özü həll etdi. Onlar həmçinin cavabları modellərin əldə edə biləcəyi açıq mənbələrdə görünməməsi üçün şifrələdilər.
Stoxastik analiz, spektral qrafik nəzəriyyəsi, simplektik həndəsə və cəbri topologiya da daxil olmaqla müxtəlif riyazi sahələrdə ümumilikdə on problem var idi. Tədqiqatçılar sualları GPT-5.1 Pro və Gemini 3 Pro da daxil olmaqla bir neçə aparıcı sistemdə sınaqdan keçirdilər və modellərə hər sual üçün yalnız bir cəhd verildi. Əlavə suallar, söhbətlər və ya həll yoluna çatmalarına kömək edə biləcək heç bir göstəriş yox idi.
“İlk Sübut” adlanan təcrübə riyazi prosesin müəyyən bir hissəsini sınaqdan keçirmək üçün nəzərdə tutulmuşdu. Tədqiqatçıların məqalələrində qeyd etdikləri kimi, “Bizim ‘ilk sübut’ təcrübəmiz riyazi tədqiqatın son və ən dəqiq müəyyən edilmiş mərhələsinə yönəlmişdir ki, bu mərhələdə sual və çərçivələr artıq başa düşülür.”
Süni intellekt mübarizə aparır
Nəticələr, süni intellekt proqramlarının mövcud bilikləri ümumiləşdirməkdə və ya məlumatlarda nümunələr tapmaqda əla olsa da, modellər problemləri tək bir cəhdlə həll etməkdə çətinlik çəkdilər.
Tədqiqatçıların ümumi nəticəsi budur ki, hazırda süni intellekt yarışma kimi tapşırıqlarda yaxşıdır, lakin naməlum mövzuları həll etmək üçün lazım olan yaradıcı dərinliyə və intuisiyaya malik deyil.
Komandanın növbəti vəzifəsi 13 fevralda şifrələnmiş həlləri buraxmaq və sonra ikinci bir problem dəsti üzərində işə başlamaqdır. Onlar First Proof-u süni intellektlə mübarizə aparmağa davam edəcək daimi etalon halına gətirmək istəyirlər və qeyd edirlər ki, “Bu anlayışdan daha rəsmi bir etalon hazırlamaq üçün istifadə etməyə ümid edirik”.
Müəllifimiz Paul Arnold tərəfindən sizin üçün yazılmış, Qeb Klark tərəfindən redaktə edilmiş və Robert Eqan tərəfindən faktlar yoxlanılmış və nəzərdən keçirilmiş bu məqalə diqqətli insan əməyinin nəticəsidir. Müstəqil elmi jurnalistikanı yaşatmaq üçün sizin kimi oxuculara güvənirik. Bu reportaj sizin üçün vacibdirsə, xahiş edirik ianə etməyi düşünün (xüsusilə aylıq). Təşəkkür olaraq reklamsız hesab əldə edəcəksiniz .
Nəşr detalları
Mohammed Abouzaid və digərləri, First Proof, arXiv (2026). DOI: 10.48550/arxiv.2602.05192
Jurnal məlumatı: arXiv
© 2026 Science X Network














