AI həqiqətən kodlaya bilərmi? Tədqiqat avtonom proqram mühəndisliyi üçün maneələri xəritələşdirir

Rachel Gordon, Massaçusets Texnologiya İnstitutu

Lisa Lock tərəfindən redaktə edilmişdir , Andrew Zinin tərəfindən nəzərdən keçirilmişdir

Redaktorların qeydləriKredit: Pixabay/CC0 Public Domain

Təsəvvür edin ki, süni intellekt proqram təminatının işlənib hazırlanmasının zəhmətkeşlərini sakitcə çiynində götürür: dolaşıq kodun yenidən işlənməsi, köhnə sistemlərin köçürülməsi və irq şərtlərinin ovlanması, beləliklə, insan mühəndisləri özlərini memarlığa, dizayna və hələ də maşının əli çatmayan əsl yeni problemlərə həsr edə bilsinlər.

Son irəliləyişlər bu gələcəyi təəccübləndirəcək qədər yaxınlaşdırmış kimi görünür, lakin MİT-in Kompüter Elmləri və Süni İntellekt Laboratoriyasının (CSAIL) və bir sıra əməkdaşlıq edən institutların tədqiqatçıları tərəfindən hazırlanan yeni bir məqalə bu potensial gələcək reallığın müasir çağırışlara ciddi nəzər salmasını tələb etdiyini iddia edir.

“Proqram Mühəndisliyi üçün Süni İntellektə Doğru Çətinliklər və Yollar” adlı bu iş kod yaratmaqdan kənar bir çox proqram-mühəndislik tapşırıqlarını xəritələşdirir, mövcud darboğazları müəyyənləşdirir və onların aradan qaldırılması üçün tədqiqat istiqamətlərini vurğulayır, insanların gündəlik işlərinin avtomatlaşdırılması zamanı diqqətini yüksək səviyyəli dizayna yönəltmək məqsədi daşıyır. Sənəd arXiv preprint serverində mövcuddur və tədqiqatçılar işlərini Vankuverdə Maşın Öyrənməsi üzrə Beynəlxalq Konfransda ( ICML 2025 ) təqdim edirlər.

Armando Solar-Lezama, MIT-nin elektrik mühəndisliyi və kompüter elmləri professoru, CSAIL-in baş müstəntiqi və tədqiqatın baş müəllifi: “Hər kəs artıq proqramçılara ehtiyacımız olmadığından danışır və bütün bu avtomatlaşdırma artıq mövcuddur” deyir.

“Bir tərəfdən, bu sahədə çox böyük irəliləyiş var. Bizim əvvəllər gördüyümüz alətlərdən qat-qat güclü olan alətlərimiz var. Amma gözlədiyimiz avtomatlaşdırmanın tam vədini əldə etmək üçün hələ çox uzun bir yol var.”

Solar-Lezama iddia edir ki, populyar rəvayətlər proqram mühəndisliyini tez-tez “bakalavriat proqramlaşdırma hissəsinə: Biri sizə kiçik bir funksiya üçün spesifikasiya verir və siz onu həyata keçirirsiniz və ya LeetCode tipli proqramlaşdırma müsahibələrini həll edirsiniz”.

Həqiqi təcrübə daha genişdir. Buraya dizaynı cilalayan gündəlik refaktorlar, həmçinin milyonlarla xətti COBOL-dan Java-ya köçürən və bütün biznesləri yenidən formalaşdıran genişmiqyaslı miqrasiya daxildir. Paralellik xətalarını tutmaq və ya sıfır gün qüsurlarını aradan qaldırmaq üçün fasiləsiz sınaq və təhlil tələb edir – qeyri-müəyyənlik, əmlaka əsaslanan test və digər üsullar. Və bu, baxım işini əhatə edir: onillik kodun sənədləşdirilməsi, yeni komanda yoldaşları üçün dəyişiklik tarixçələrinin ümumiləşdirilməsi və üslub, performans və təhlükəsizlik üçün cəlbedici sorğuların nəzərdən keçirilməsi.

Sənaye miqyaslı kodun optimallaşdırılması – GPU ləpələrinin yenidən tənzimlənməsi və ya Chrome-un V8 mühərrikinin arxasında dayanmayan, çox qatlı təkmilləşdirmələr – qiymətləndirmək inadla çətin olaraq qalır. Bugünkü başlıq ölçüləri qısa, müstəqil problemlər üçün nəzərdə tutulmuşdu və çoxseçimli testlər hələ də təbii dil tədqiqatlarında üstünlük təşkil etsə də, kod üçün AI-də heç vaxt norma olmayıb.

Sahənin faktiki meyarları olan SWE-Bench, sadəcə olaraq bir modeldən GitHub problemini həll etməyi xahiş edir: faydalı, lakin yenə də “bakalavriat proqramlaşdırma məşqi” paradiqmasına bənzəyir. O, yalnız bir neçə yüz sətir koda toxunur, ictimai depolardan məlumat sızması riski ilə üzləşir və digər real dünya kontekstlərinə məhəl qoymur – AI ilə dəstəklənən refaktorlar, insan-AI cütünün proqramlaşdırılması və ya milyonlarla sətiri əhatə edən performans baxımından kritik yenidən yazılar. Bu yüksək riskli ssenariləri ələ keçirmək üçün meyarlar genişlənənə qədər, tərəqqinin ölçülməsi və bununla da onu sürətləndirilməsi açıq problem olaraq qalacaq.

Ölçmə bir maneədirsə, insan-maşın əlaqəsi başqa bir maneədir. MIT-nin elektrik mühəndisliyi və kompüter elmləri üzrə magistr tələbəsi olan birinci müəllif Aleks Qu bugünkü qarşılıqlı əlaqəni “incə bir əlaqə xətti” kimi görür. Sistemdən kod yaratmağı xahiş etdikdə, o, tez-tez böyük, strukturlaşdırılmamış fayl və hətta bir sıra vahid testləri alır, lakin bu testlər səthi olur. Bu boşluq süni intellektin insanların dəqiq nəzarət və daha dərin dərk etmək üçün etibar etdiyi sazlayıcılardan tutmuş statik analizatorlara qədər daha geniş proqram mühəndisliyi alətlərindən səmərəli istifadə etmək qabiliyyətinə qədər uzanır.

“Mən həqiqətən modelin yazdıqlarına çox nəzarət etmirəm” deyir. “Süni intellekt üçün öz inamını ifşa edəcək kanal olmadan—”bu hissə düzgündür… bu hissə, bəlkə də ikiqat yoxlamaq” — tərtibatçılar kor-koranə yığılan hallüsinasiya məntiqinə etibar etmək riski ilə üzləşirlər, lakin istehsalda çökürlər. Digər kritik aspekt süni intellektin nə vaxt istifadəçiyə aydınlıq gətirəcəyini bilməkdir.”

Tərəzi bu çətinlikləri birləşdirir. Hazırkı AI modelləri çox vaxt milyonlarla sətirləri əhatə edən böyük kod bazaları ilə dərindən mübarizə aparır. Vəqf modelləri ictimai GitHub-dan öyrənir, lakin “hər bir şirkətin kod bazası bir növ fərqli və unikaldır” deyən Gu, özəl kodlaşdırma konvensiyalarını və spesifikasiya tələblərini əsaslı şəkildə paylanmadan çıxararaq deyir.

Nəticə inandırıcı görünən, lakin mövcud olmayan funksiyaları çağıran, daxili üslub qaydalarını pozan və ya davamlı inteqrasiya boru kəmərlərini uğursuz edən koddur. Bu, çox vaxt süni intellekt tərəfindən yaradılan “halüsinasiya edən” koda gətirib çıxarır, yəni o, inandırıcı görünən, lakin müəyyən bir şirkətin xüsusi daxili konvensiyaları, köməkçi funksiyaları və ya memarlıq nümunələri ilə uyğun gəlməyən məzmun yaradır.

Modellər də tez-tez səhv əldə edəcəklər, çünki o, funksionallıq və məntiqdən daha çox oxşar ada (sintaksis) malik kodu alır, bu da modelin funksiyanı necə yazacağını bilməsi üçün lazım ola bilər. Solar-Lezama deyir: “Standart axtarış üsulları eyni şeyi edən, lakin fərqli görünən kod parçaları ilə çox asanlıqla aldanır”.

Müəlliflər qeyd edirlər ki, bu məsələlərə heç bir gümüş güllə olmadığından, onlar bunun əvəzinə icma miqyaslı səylərə çağırırlar: daha zəngin, tərtibatçıların kod yazması prosesini ələ keçirən məlumatlara sahib olmaq (məsələn, kod tərtibatçıları hansı kodu atmağa qarşı saxlayırlar, kodun zamanla necə refaktorlaşdırılır və s.), refaktorun keyfiyyəti, səhvlərin aradan qaldırılması və səhvlərin aradan qaldırılması üzrə irəliləyişi ölçən paylaşılan qiymətləndirmə paketləri; modellərə qeyri-müəyyənliyi üzə çıxarmağa və passiv qəbuldan daha çox insanı idarə etməyə dəvət etməyə imkan verən şəffaf alətlər.

Gu gündəmi heç bir laboratoriyanın tək başına toplaya bilməyəcəyi daha böyük açıq mənbəli əməkdaşlıqlar üçün “fəaliyyətə çağırış” kimi tərtib edir. Solar-Lezama artan irəliləyişləri – “tədqiqat nəticələrinin bu problemlərin hər birinin ayrı-ayrılıqda dişləməsini” təsəvvür edir ki, bu da kommersiya alətlərinə geri qayıdır və AI-ni avtomatik tamamlama köməkçisindən həqiqi mühəndislik tərəfdaşına doğru tədricən köçürür.

“Niyə bunlardan hər hansı biri əhəmiyyət kəsb edir? Proqram təminatı artıq maliyyə, nəqliyyat, səhiyyə və gündəlik həyatın xırdalıqlarını dəstəkləyir və onu təhlükəsiz qurmaq və saxlamaq üçün tələb olunan insan səyi darboğaza çevrilir. İşin öhdəsindən gələ bilən süni intellekt – və bunu gizli uğursuzluqlar təqdim etmədən edə bilər – tərtibatçıları yaradıcılığa, strategiyaya, strategiyaya diqqət yetirməkdən azad edər”.

“Lakin bu gələcək kodun tamamlanmasının asan tərəf olduğunu etiraf etməkdən asılıdır ; çətin tərəf isə hər şeydir. Məqsədimiz proqramçıları əvəz etmək deyil. Onları gücləndirməkdir. Süni intellekt yorucu və qorxunc işlərin öhdəsindən gələ bildikdə, insan mühəndisləri nəhayət vaxtlarını yalnız insanların edə biləcəyi işlərə sərf edə bilərlər.”

Mistral AI-nin süni intellekt üzrə alimi Baptiste Rozière deyir: “Kodlaşdırma üçün süni intellektdə çoxlu yeni əsərlər ortaya çıxır və cəmiyyət tez-tez ən son tendensiyaları təqib edir, geri çəkilmək və hansı problemlərin həll edilməsinin ən vacib olduğunu düşünmək çətin ola bilər”. “Mən bu məqaləni oxumaqdan həzz aldım, çünki o, proqram mühəndisliyi üçün süni intellektdə əsas vəzifələr və problemlər haqqında aydın icmal təqdim edir . O, həmçinin bu sahədə gələcək tədqiqatlar üçün perspektivli istiqamətləri qeyd edir.”

Daha çox məlumat: Alex Gu et al, Proqram Mühəndisliyi üçün AI-yə doğru Çətinliklər və Yollar, arXiv (2025). DOI: 10.48550/arxiv.2503.22625

Jurnal məlumatı: arXiv Massaçusets Texnologiya İnstitutu tərəfindən təmin edilmişdir

Bu hekayə MIT News ( web.mit.edu/newsoffice/ ), MİT tədqiqatı, innovasiya və tədrisi haqqında xəbərləri əhatə edən məşhur saytın izni ilə yenidən nəşr edilmişdir .

BE	ÇA	Ç	CA	C	Ş	B
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28	29
30	31

Tədqiqat sənədlərində Nyu-Hempşirdə gənc...

Tədqiqat göstərir ki, fotoreseptor...

Elektrik enerjisi istehsal edən...

Şənbə Sitatları: Darıxdırıcı səslərin...

Pi Günü: Raketlərdən xərçəng...

Araşdırmalar göstərir ki, Eaton...

AI həqiqətən kodlaya bilərmi? Tədqiqat avtonom proqram mühəndisliyi üçün maneələri xəritələşdirir

Tədqiqat sənədlərində Nyu-Hempşirdə gənc dişi balıqçının.

Tədqiqat göstərir ki, fotoreseptor hüceyrələrində hüceyrə.

Elektrik enerjisi istehsal edən bakteriyalar: Molyusk.

Şənbə Sitatları: Darıxdırıcı səslərin nevrologiyası; bir.

AI həqiqətən kodlaya bilərmi? Tədqiqat avtonom proqram mühəndisliyi üçün maneələri xəritələşdirir

Share: