Dünyanın ən böyük Olimpiada səviyyəli riyaziyyat məsələlərinin toplusu artıq hər kəs üçün əlçatandır
Reyçel Qordon, Massaçusets Texnologiya İnstitutu
Lisa Lock tərəfindən redaktə edilib , Robert Egan tərəfindən nəzərdən keçirilib
Tercih edilən mənbə kimi əlavə edin
MathNet, indiyə qədər yaradılmış ən böyük yüksək keyfiyyətli sübut əsaslı riyazi məsələlər toplusudur. O, 47 ölkəni, 17 dildə və 143 müsabiqəni əhatə edən 30.000-dən çox mütəxəssis tərəfindən yazılmış məsələ və həllərdən ibarətdir. Mənbə: Shaden Alshammari
Hər il Beynəlxalq Riyaziyyat Olimpiadasında yarışan ölkələr ən yaxşı və ən orijinal məsələlərinin kitabçası ilə gəlirlər. Həmin kitabçalar nümayəndə heyətləri arasında paylaşılır, sonra isə səssizcə yoxa çıxır. Heç kim onları sistematik şəkildə toplamamış, təmizləməmiş və əlçatan etməmişdi – nə riyazi düşüncənin hüdudlarını sınaqdan keçirən süni intellekt tədqiqatçıları, nə də dünyanın hər yerindən bu yarışlara əsasən təkbaşına hazırlaşan şagirdlər üçün.
MIT-in Kompüter Elmləri və Süni İntellekt Laboratoriyası (CSAIL), Kral Abdullah Elm və Texnologiya Universiteti (KAUST) və HUMAIN tədqiqatçıları artıq məhz bunu ediblər.
MathNet , indiyə qədər yaradılmış ən böyük yüksək keyfiyyətli sübut əsaslı riyazi məsələlər toplusudur və hələ də bağlanmayıb. 47 ölkəni, 17 dili və 143 müsabiqəni əhatə edən 30.000-dən çox mütəxəssis tərəfindən yazılmış məsələ və həlldən ibarət olan bu toplu, öz növünün ən böyük məlumat toplusundan beş dəfə böyükdür. Əsər bu ayın sonunda Braziliyada keçiriləcək Beynəlxalq Təlim Nümayəndəlikləri Konfransında ( ICLR 2026 ) təqdim olunacaq.
MathNet-i fərqləndirən təkcə ölçüsü deyil, həm də genişliyidir. Əvvəlki Olimpiada səviyyəli məlumat dəstləri, demək olar ki, yalnız ABŞ və Çindəki yarışlardan əldə edilir. MathNet altı qitədə onlarla ölkəni əhatə edir, 17 dili əhatə edir, həm mətn, həm də şəkil əsaslı məsələləri və həlləri əhatə edir və dörd onillik yarış riyaziyyatını əhatə edir. Məqsəd, yalnız ən görünənləri deyil, qlobal riyaziyyat icmasında mövcud olan riyazi perspektivlərin və problem həll etmə ənənələrinin tam spektrini əhatə etməkdir.
MIT doktorantı və qəzetin aparıcı müəllifi Şaden Əlşəmmari bildirib ki, “Hər ölkə özünün ən yeni və ən yaradıcı problemlərindən ibarət kitabça gətirir. Onlar bukletləri bir-biri ilə bölüşürlər, lakin heç kim onları toplamaq, təmizləmək və internetə yükləmək üçün səy göstərməyib”.
MathNet-in qurulması, rəqəmsal sənədləri və onilliklər əvvəl skan edilmiş sənədləri əhatə edən, ümumilikdə 25.000 səhifədən çox olan 1595 PDF cildinin izlənməsini tələb edirdi. Arxivin əhəmiyyətli bir hissəsi gözlənilməz bir mənbədən gəlirdi: uzun müddət IMO icma xadimi və həmmüəllif olan, 2006-cı ildən bəri həmin bukletləri əl ilə toplayıb skan edən Navid Safaei. Onun şəxsi arxivi məlumat dəstinin əsasını təşkil edirdi.
Mənbə miqyas qədər vacibdir. Mövcud riyazi məlumat dəstlərinin əksəriyyəti problemləri Problem Həlli Sənəti (AoPS) kimi icma forumlarından götürdüyü halda, MathNet yalnız rəsmi milli müsabiqə kitabçalarından istifadə edir. Bu kitabçalardakı həllər ekspertlər tərəfindən yazılıb və həmyaşıdlar tərəfindən nəzərdən keçirilib və çox vaxt birdən çox səhifəyə qədər uzanır və müəlliflər eyni problemə bir neçə yanaşmadan keçirlər.
Bu dərinlik süni intellekt modellərinə icma mənbəli məlumat dəstlərinə xas olan qısa, qeyri-rəsmi həllərdən daha çox riyazi mühakiməni öyrənmək üçün daha zəngin bir siqnal verir. Bu, həm də məlumat dəstinin tələbələr üçün həqiqətən faydalı olduğu anlamına gəlir: IMO və ya milli müsabiqəyə hazırlaşan hər kəs artıq dünyanın hər yerindən gələn ənənələrdən ibarət yüksək keyfiyyətli problemlərin və işlənmiş həllərdən ibarət mərkəzləşdirilmiş, axtarış edilə bilən bir kolleksiyaya çıxış əldə edə bilər.
“Fərdi səy göstərdiyim çoxlu tələbəni xatırlayıram. Ölkələrində heç kim onları bu cür yarışlara hazırlamırdı”, – deyə özü də tələbə kimi Beynəlxalq Olimpiya Komitəsində yarışan Alşammari bildirib. “Ümid edirik ki, bu, onlara yüksək keyfiyyətli problemlər və öyrəniləcək həllər ilə mərkəzləşdirilmiş bir yer verəcək”.
Gündəlik məlumat üçün Phys.org-a etibar edən 100.000-dən çox abunəçi ilə elm, texnologiya və kosmosdakı ən son yenilikləri kəşf edin . Pulsuz bülletenimizə abunə olun və vacib olan nailiyyətlər, innovasiyalar və tədqiqatlar haqqında gündəlik və ya həftəlik yeniliklərdən xəbərdar olun .
Komandanın IMO icmasında dərin kökləri var. Həmmüəllif olan Sultan Albarakati hazırda IMO idarə heyətində çalışır və tədqiqatçılar məlumat dəstini birbaşa IMO fondu ilə paylaşmaq üzərində işləyirlər. Məlumat dəstini təsdiqləmək üçün onlar Ermənistan, Rusiya, Ukrayna, Vyetnam və Polşa da daxil olmaqla ölkələrdən 30-dan çox insan qiymətləndiricisindən ibarət qiymətləndirmə qrupu yaratdılar və onlar minlərlə həlli yoxlamaq üçün birlikdə koordinasiya etdilər.
İsveçrənin IMO-nun müavini Taniş Patil deyir ki, “MathNet verilənlər bazası həm tələbələr, həm də üzərində işləmək üçün yeni problemlər axtaran və ya çətin bir suala həll yolu axtaran liderlər üçün əla bir mənbə olma potensialına malikdir. Olimpiada problemlərinin digər arxivləri mövcud olsa da (xüsusən də AoPS-dəki Müsabiqə Kolleksiyaları forumları), bu resurslarda standart formatlaşdırma sistemi, təsdiqlənmiş həllər və mövzuların və nəzəriyyənin tələb etdiyi vacib problem metaməlumatları yoxdur.
“Bu məlumat dəstinin mühakimə modellərinin performansını artırmaq üçün necə istifadə edildiyini və yeni olimpiada sualları yaratarkən vacib bir məsələyə, yəni bir problemin həqiqətən orijinal olub olmadığını müəyyən etməyə etibarlı şəkildə cavab verə biləcəyimizi görmək də maraqlı olacaq.”
MathNet həmçinin süni intellekt performansı üçün ciddi bir etalon rolunu oynayır və nəticələr süni intellekt riyaziyyatının bacarığı haqqında son xəbərlərdə göstəriləndən daha mürəkkəb bir mənzərəni ortaya qoyur. Sərhəd modelləri fövqəladə irəliləyiş əldə edib: bəzilərinin IMO-da qızıl medal qazandığı bildirilir və standart etalonlarda onlar indi əksər insanları çaşdıracaq problemləri həll edirlər. Lakin MathNet göstərir ki, irəliləyiş qeyri-bərabərdir.
Hətta sınaqdan keçirilmiş ən yüksək performanslı model olan GPT-5 belə, MathNet-in əsas etalonu olan 6400 məsələdə orta hesabla 69,3% nəticə göstərərək, Olimpiada səviyyəli məsələlərin təxminən üçdə birində uğursuz oldu. Məsələlər rəqəmləri əhatə etdikdə, performans ümumilikdə əhəmiyyətli dərəcədə aşağı düşür və vizual mühakiməni hətta ən bacarıqlı modellər üçün də davamlı zəif nöqtə kimi ortaya qoyur.
Bir neçə açıq mənbəli model monqol dilindəki problemlərdə 0% bal toplayıb ki, bu da mövcud süni intellekt sistemlərinin ümumi gücünə baxmayaraq, çatışmayan digər bir cəhəti vurğulayır. Alşammari deyib: “GPT modelləri ingilis və digər dillərdə eyni dərəcədə yaxşıdır. Lakin açıq mənbəli modellərin çoxu monqol kimi daha az yayılmış dillərdə tamamilə uğursuz olur.”
MathNet-in müxtəlifliyi həmçinin süni intellekt modellərinin riyaziyyatı necə öyrənməsindəki daha dərin bir məhdudiyyəti aradan qaldırmaq üçün hazırlanmışdır. Təlim məlumatları ingilis və çin məsələlərinə doğru əyildikdə, modellər riyazi mədəniyyətin dar bir hissəsini mənimsəyir. Rumıniya kombinatorikası məsələsi və ya Braziliya ədəd nəzəriyyəsi məsələsi eyni əsas konsepsiyaya tamamilə fərqli bir bucaqdan yanaşa bilər. Tədqiqatçılar iddia edirlər ki, bu diapazona məruz qalma həm insanları, həm də süni intellekt sistemlərini daha yaxşı riyazi mütəfəkkir edir.
Problem həllindən əlavə, MathNet, modellərin iki problemin eyni əsas riyazi quruluşu paylaşdığını tanıya bilib-bilmədiyini soruşan bir axtarış etalonu təqdim edir ki, bu da həm süni intellekt inkişafı, həm də riyaziyyat icmasının özü üçün vacib olan bir qabiliyyətdir. İllər ərzində real IMO imtahanlarında demək olar ki, təkrarlanan məsələlər ortaya çıxmışdır, çünki müxtəlif notasiyalar, dillər və formatlar arasında riyazi ekvivalentlikləri tapmaq, hətta mütəxəssis insan komitələri üçün belə, həqiqətən çətindir.
Səkkiz ən müasir yerləşdirmə modelini sınaqdan keçirən tədqiqatçılar, hətta ən güclülərinin belə ilk cəhddə yalnız 5%-də düzgün uyğunluğu müəyyən etdiyini, modellərin isə tez-tez struktur baxımından əlaqəsiz problemləri ekvivalent problemlərdən daha oxşar kimi qiymətləndirdiyini aşkar etdilər.
Məlumat dəstinə həmçinin, modelə yeni bir problemi həll etməsini istəməzdən əvvəl strukturla əlaqəli bir problem verməyin performansı yaxşılaşdırıb-yaxşılaşdırmadığını yoxlayan axtarışla artırılmış generasiya (RAG) etalonu da daxildir. Bu, yaxşılaşır, lakin yalnız əldə edilən problem həqiqətən aktual olduqda. DeepSeek-V3.2-Speciale yaxşı uyğunlaşdırılmış axtarışla 12 faiz bala qədər qazanc əldə etdi, əlaqəsiz axtarış isə təxminən 22% hallarda performansı aşağı saldı.
Əlşəmmari məqaləni Safaei, HUMAIN süni intellekt mühəndisi Əbrar Zaynal, KAUST Akademiyasının direktoru Sultan Albarakati və MIT CSAIL həmkarları: magistr tələbəsi Kevin Ven SB ’25; Microsoft-un baş mühəndislik meneceri Mark Hamilton SM ’22, fəlsəfə doktoru ’25; və professorlar William Freeman və Antonio Torralba ilə birlikdə yazıblar.
Massaçusets Texnologiya İnstitutu tərəfindən təmin edilir














