ChatGPT kimi süni intellektin insani anlayışa çatmayacağının səbəbi budur
ChatGPT-dən onun insan kimi düşünüb-düşünmədiyini soruşsanız, bu chatbot sizə bunun olmadığını söyləyəcək. ChatGPT yazır: “Mən dili müəyyən dərəcədə emal edə və başa düşə bilərəm”. Lakin “mənim anlayışım insana xas anlayışa deyil, verilənlərdəki nümunələrə əsaslanır.”
Yenə də bu süni intellekt və ya AI sistemi ilə danışmaq bəzən insanla danışmaq kimi hiss edilə bilər. Olduqca ağıllı, istedadlı insan. ChatGPT riyaziyyat və ya tarixlə bağlı suallara tələb əsasında və bir çox müxtəlif dillərdə cavab verə bilər. O, hekayələri və kompüter kodunu çıxara bilər. Digər oxşar “generativ” AI modelləri sıfırdan sənət əsərləri və videolar istehsal edə bilər.
Gəlin süni intellekt haqqında öyrənək
“Bu şeylər həqiqətən ağıllı görünür” dedi Melanie Mitchell. O, Nyu-Meksikodakı Santa Fe İnstitutunda kompüter alimidir. O, Amerika Elmin İnkişafı Assosiasiyasının illik toplantısında çıxış edib . Fevral ayında Denverdə, Koloradoda keçirildi.
Süni intellektin artan “ağılları” bir çox insanı narahat edir. Onlar qorxurlar ki, generativ süni intellekt insanların işini ələ keçirə və ya dünyanı ələ keçirə bilər. Lakin Mitchell və digər ekspertlər bu qorxuların həddindən artıq çox olduğunu düşünürlər. Heç olmasa, hələlik.
Mütəxəssislərin fikrincə, problem ChatGPT-nin dediyi kimidir. Bugünkü ən təsirli süni intellekt hələ də onun nə dediyini və ya bir insanın etdiyi kimi etdiyini başa düşmür. Və bu, onun qabiliyyətlərinə bəzi sərt məhdudiyyətlər qoyur.
Tərbiyəçilər və Valideynlər, Fırıldaq Vərəqinə Qeydiyyatdan Keçin
Tədris mühitində Science News Explores istifadə etməyinizə kömək edəcək həftəlik yeniləmələrE-poçt ünvanı*Get
AI ilə bağlı narahatlıqlar yeni deyil
İnsanlar onilliklərdir ki, maşınların çox ağıllı olmasından narahatdırlar. Bu qorxu ən azı 1997-ci ildən başlayır. Məhz o zaman Deep Blue kompüteri şahmat üzrə dünya çempionu Qarri Kasparovu məğlub etdi.
O vaxtlar, süni intellektin yaxşı etdiyimiz bir çox işdə uğursuz olduğunu göstərmək hələ də asan idi. Əlbəttə, bir kompüter orta şahmat oyunu oynaya bilər. Ancaq xəstəliyi diaqnoz edə bilərmi? Nitq transkripsiya edilsin? Çox yaxşı deyil. Bir çox əsas sahələrdə insanlar üstün olaraq qaldılar.
Təxminən on il əvvəl bu dəyişməyə başladı.
Neyron şəbəkələri kimi tanınan kompüter beyinləri dərin öyrənmə adlı yeni texnikadan böyük təkan aldı . Bu güclü maşın öyrənmə növüdür. Maşın öyrənməsində kompüterlər təcrübə və ya nümunələrə baxaraq bacarıqlara yiyələnirlər.
Birdən, dərin öyrənmə sayəsində kompüterlər bir çox vəzifələrdə insanlarla rəqabət apardılar. Maşınlar şəkilləri müəyyən edə, işarələri oxuya və fotoşəkilləri təkmilləşdirə bilərdi. Onlar hətta nitqi etibarlı şəkildə mətnə çevirə bilirdilər.
Lakin bu qabiliyyətlərin öz həddi var idi. Birincisi, dərindən öyrənən neyron şəbəkələrini aldatmaq asan ola bilər. Məsələn, dayanma nişanına yerləşdirilən bir neçə stiker süni intellektə bu işarənin “Sürət həddi 80” olduğunu düşünməyə vadar etdi. Belə “ağıllı” kompüterlər də geniş təlim tələb edirdi. Hər bir yeni bacarıq əldə etmək üçün onlar nə etməli olduğuna dair tonlarla nümunəyə baxmalı idilər.
Beləliklə, dərin öyrənmə çox xüsusi işlərdə əla olan AI modelləri istehsal etdi. Lakin bu sistemlər bu təcrübəni yeni vəzifələrə çox yaxşı uyğunlaşdıra bilmədi. Məsələn, fransızca ev tapşırığınızda kömək üçün İngilis-İspan AI tərcüməçisindən istifadə edə bilməzsiniz.
Amma indi hər şey yenidən dəyişir.
“Biz süni intellektin yeni dövründəyik” deyir Mitchell. “Biz 2010-cu illərin dərin öyrənmə inqilabından kənardayıq. İndi biz 2020-ci illərin generativ süni intellekt dövründəyik”.
Bu gen-AI dövrü
Generativ süni intellekt sistemləri tələb əsasında mətn, şəkillər və ya digər məzmun istehsal edə bilən sistemlərdir. Bu növ süni intellekt çoxdan insan yaradıcılığını tələb edən bir çox şeyi yarada bilər. Bura beyin fırtınası ideyalarından tutmuş şeirlər yazmağa qədər hər şey daxildir.
Bu qabiliyyətlərin çoxu böyük dil modellərindən – qısaca LLM-lərdən qaynaqlanır. ChatGPT, LLM-lərə əsaslanan texnologiyanın bir nümunəsidir. Bu cür dil modellərinin “böyük” olduğu deyilir, çünki onlar böyük həcmdə verilənlər üzərində öyrədilmişdir. Əslində, onlar saysız-hesabsız çap kitablarının skan edilmiş nüsxələri daxil olmaqla internetdə hər şeyi öyrənirlər.
“Böyük” eyni zamanda LLM-lərin oxuyarkən “öyrənə” biləcəyi müxtəlif növ şeylərin sayına da aid ola bilər. Bu modellər sadəcə sözləri öyrənmir. Onlar həmçinin ifadələri, simvolları və riyazi tənlikləri götürürlər.
https://www.youtube.com/embed/iR2O2GPbB0E?feature=oembed&enablejsapi=1&origin=https:%2F%2Fwww.snexplores.orgBudur, hansı böyük dil modellərinin və onların edə biləcəyi şeylərin qısa xülasəsi.
Dilin tikinti bloklarının necə birləşdirildiyinə dair nümunələri öyrənməklə, LLM-lər sözlərin hansı ardıcıllıqla getməsini proqnozlaşdıra bilər. Bu, modellərə cümlələr yazmağa və suallara cavab verməyə kömək edir. Əsasən, LLM müəyyən bir kontekstdə bir sözün digərini izləməsi ehtimalını hesablayır.
Bu, LLM-lərə istənilən müəllifin üslubunda yazmaq və tapmacaları həll etmək kimi işləri görməyə imkan verdi.
Bəzi tədqiqatçılar təklif etdilər ki, LLM-lər bu nailiyyətləri yerinə yetirdikdə nə etdiklərini başa düşürlər. Bu tədqiqatçılar, LLM-lərin insanlar kimi düşünə biləcəyini və ya hətta müəyyən mənada şüurlu ola biləcəyini düşünürlər.
Lakin Mitchell və başqaları israr edirlər ki, LLM-lər (hələ) dünyanı həqiqətən dərk etmirlər. Ən azından insanların etdiyi kimi deyil.
Dar düşüncəli AI
Mitchell və onun həmkarı Martha Lewis bu yaxınlarda LLM-lərin bir əsas limitini ifşa etdilər. Lyuis İngiltərənin Bristol Universitetində dil və anlayışları öyrənir. Cütlük işlərini arXiv.org saytında paylaşıblar. (Orada dərc edilmiş tədqiqatlar adətən hələ digər elm adamları tərəfindən yoxlanılmayıb.)
LLM-lər hələ də insanların bir bacarığı yeni vəziyyətə uyğunlaşdırmaq qabiliyyətinə uyğun gəlmir, onların yeni sənədləri göstərir. Bu hərf-sətir problemini nəzərdən keçirin. Siz bir hərf silsiləsi ilə başlayırsınız: ABCD. Sonra ikinci hərflər silsiləsi alırsınız: ABCE.
İnsanların çoxu iki sim arasındakı fərqi görə bilir. Birinci sətirdəki son hərf ikinci sətirdəki əlifbanın növbəti hərfi ilə əvəz olunur. Beləliklə, insanlara IJKL kimi fərqli hərflər sətri göstərildikdə, onlar ikinci sətirin nə olacağını təxmin edə bilərlər: IJKM.
Əksər LLM-lər də bu problemi həll edə bilər. Bu gözləniləndir. Modellər, nəhayət, ingilis əlifbası üzrə yaxşı təlim keçiblər.
Elmi sualınız var? Biz kömək edə bilərik!
Sualınızı burada təqdim edin və biz ona Science News Explores jurnalının qarşıdan gələn sayında cavab verə bilərik
Amma deyin ki, siz başqa əlifba ilə problem yaradırsınız. Ola bilsin ki, əlifbamızdakı hərfləri qarışdırıb fərqli sıraya salırsınız. Yaxud hərflər yerinə simvollardan istifadə edirsiniz. İnsanlar hələ də hərf-sətir problemlərini həll etməkdə çox bacarıqlıdırlar. Lakin LLM-lər adətən uğursuz olur. Bir əlifba ilə öyrəndikləri məfhumları götürüb digər əlifbada tətbiq edə bilmirlər. Mitchell və Lewis tərəfindən sınaqdan keçirilmiş bütün GPT modelləri bu cür problemlərlə mübarizə aparırdı.
Digər oxşar vəzifələr də göstərir ki, LLM-lər öyrədilmədikləri vəziyyətlərdə yaxşı iş görmürlər. Bu səbəbdən Mitçel onların insanların dünyanı “dərk etmək” adlandıracaqlarını göstərdiyinə inanmır.
Anlamanın əhəmiyyəti
“Etibarlı olmaq və yeni vəziyyətdə doğru şeyi etmək, mənim fikrimcə, anlayışın əslində nə demək olduğunun əsasını təşkil edir” dedi Mitchell AAAS iclasında.
O deyir ki, insan anlayışı “anlayışlara” əsaslanır. Bunlar kateqoriyalar, vəziyyətlər və hadisələr kimi şeylərin zehni modelləridir . Konsepsiyalar insanlara səbəb və nəticəni müəyyən etməyə imkan verir. Onlar həmçinin insanlara müxtəlif hərəkətlərin mümkün nəticələrini proqnozlaşdırmağa kömək edir. İnsanlar bunu əvvəllər görmədikləri vəziyyətlərdə də edə bilərlər.
“İnsanlar haqqında həqiqətən diqqətəlayiq olan odur ki, biz konsepsiyalarımızı yeni vəziyyətlərə mücərrəd edə bilərik” dedi Mitchell.
O inkar etmir ki, süni intellekt nə vaxtsa insanlar kimi ağıllı anlayış səviyyəsinə çata bilər. Lakin maşın anlayışı insan anlayışından fərqli ola bilər, o əlavə edir. Hansı texnologiyanın bu anlayışa nail ola biləcəyini heç kim bilmir. Ancaq bu, insan anlayışı kimi bir şeydirsə, çox güman ki, LLM-lərə əsaslanmayacaq.
Axı, LLM-lər insanlara əks şəkildə öyrənirlər. Bu modellər dil öyrənməyə başlayır. Sonra onlar bu biliklərdən mücərrəd anlayışları qavramaq üçün istifadə etməyə çalışırlar. İnsan körpələri isə əvvəlcə anlayışları, sonra onları təsvir etmək üçün dili öyrənirlər.
Beləliklə, ChatGPT ilə danışmaq bəzən dostunuz, komanda yoldaşınız və ya tərbiyəçinizlə danışmaq kimi hiss edilə bilər. Ancaq bunun arxasında kompüterləşdirilmiş rəqəmlər hələ də insan ağlına bənzəmir.
Güclü Sözlər
mücərrəd : İdeya və ya düşüncə kimi mövcud olan, lakin real dünyada konkret və ya maddi (toxunula bilən) olmayan bir şey. Gözəllik, sevgi və yaddaş abstraksiyadır; avtomobillər, ağaclar və su beton və maddidir.
Amerika Elmin İnkişafı Assosiasiyası : (və ya AAAS ) 1848-ci ildə yaradılmış, milli səviyyədə elmin və mühəndisliyin inkişafına kömək etmək və onun bütün fənlərinin maraqlarını təmsil etmək üçün yaradılmış ilk daimi təşkilat idi. İndi dünyanın ən böyük belə cəmiyyətidir. Adına baxmayaraq, ona üzvlük “elm, texnologiya, mühəndislik və riyaziyyatın bu gün dünyanın üzləşdiyi bir çox problemlərin həllinə kömək edə biləcəyinə” inanan hər kəs üçün açıqdır. Onun üzvləri 90-dan çox ölkədə yaşayır. Vaşinqtonda yerləşən o, bir sıra resenziyalı jurnalları, xüsusən də Elmi nəşr edir.
süni intellekt : Maşınlar və ya kompüterlər tərəfindən nümayiş etdirilən biliyə əsaslanan qərar qəbuletmə növü. Termin eyni zamanda elm adamlarının ağıllı davranışa qadir olan maşınlar və ya kompüter proqramları yaratmağa çalışdıqları tədqiqat sahəsinə də aiddir.
chatbot : İnsan istifadəçiləri ilə zahirən söhbət etmək üçün yaradılmış kompüter proqramı. Müasir olanlar (məsələn, Siri, Alexa, Ocelot və Sprinklr) xəbər hadisələri və ya sinif mövzuları haqqında internet üzərindən məlumat əldə edə bilər. Bir çoxları hətta mağazalar, apteklər və ya banklar adından alışlar, məhsullar və ya planlaşdırma ilə bağlı suallara cavab vermək üçün rəqəmsal köməkçi kimi işləyirlər.
kod : (hesablamada) Kompüteri bir şey etməyə məcbur edən proqramı yazmaq və ya ona yenidən baxmaq üçün xüsusi dildən istifadə etmək. (n.) Kod həmçinin kompüterin əməliyyatlarını təlimatlandıran proqramlaşdırmanın xüsusi hissələrinin hər birinə aiddir.
həmkar : Başqası ilə işləyən biri; iş yoldaşı və ya komanda üzvü.
kontekst : Bir hadisəni, bəzi bəyanatı və ya hansısa nəticəni izah etməyə kömək edən şərait və ya şərait.
dərin öyrənmə : Bəzi kompüterlər tərəfindən istifadə edilən maşın öyrənmə növü. O, insan beyninə bənzər şəkildə işləmək üçün nəzərdə tutulmuş neyron şəbəkələrinin təbəqələrinə əsaslanır. Bu şəbəkələr tendensiyaları tapmaq üçün böyük məlumat dəstlərini süzür. Hər bir təbəqə hesablamalar aparır və təkrar-təkrar yeni proqnozlar verir. Sonra sistem zamanla “daha ağıllı” olmaq üçün öyrəndiklərini birləşdirir.
diaqnostika : Səbəblərini axtarmaq üçün ipuçlarını və ya simptomları təhlil etmək. Nəticə adətən diaqnozla nəticələnir – səbəbkar problemin və ya xəstəliyin müəyyən edilməsi.
tənlik : Riyaziyyatda iki kəmiyyətin bərabər olduğu ifadəsi. Həndəsədə tənliklər tez-tez əyri və ya səthin formasını təyin etmək üçün istifadə olunur.
zəka : bilik və bacarıqları toplamaq və tətbiq etmək bacarığı.
böyük dil modeli : (hesablamada) Dil modelləri maşın öyrənməsinin bir növüdür. Qarşıdan gələn sözləri (mətn və ya nitqdə) təxmin etməyə çalışırlar və sonra demək olar ki, hər kəsin başa düşməli olduğu sözlərdən istifadə edərək bu proqnozları təqdim edirlər. Modellər bunu böyük miqdarda mətn və ya nitqi nəzərdən keçirərək öyrənirlər. Adından da göründüyü kimi, böyük dil modelləri böyük məlumat ehtiyatlarından istifadə edərək məşq edirlər. Onlar “neyron şəbəkələri” – insan beynindəki sinir yollarından bir qədər kənarda qurulmuş bir sxemdən istifadə edərək bu məlumatları təşkil edir və mənalandırırlar. Böyük dil modelləri təkcə sözləri deyil, həm də çoxlu sözlərdən ibarət ifadələri öyrənir. Onlar hətta yeni ifadə və fikrin ifadə olunduğu kontekstdən öyrənə bilərlər (həmin ifadələri müşayiət edən və ya həmin ifadələrin daxil olduğu sözlər nəzərdə tutulur).
maşın öyrənməsi : Kompüter elmində kompüterlərə nümunələrdən və ya təcrübələrdən öyrənməyə imkan verən bir texnika. Maşın öyrənməsi süni intellektin (AI) bəzi formalarının əsasını təşkil edir. Məsələn, bir maşın öyrənmə sistemi xərçəngli insanlarda ağciyər toxumasının rentgen şüalarını müqayisə edə bilər və sonra bunları xəstənin müəyyən bir müalicə aldıqdan sonra sağ qalıb-qalmadığı və nə qədər müddətə sağ qaldığı ilə müqayisə edə bilər. Gələcəkdə bu süni intellekt sistemi yeni xəstənin ağciyər skanlarına baxa və onların müalicəyə nə dərəcədə yaxşı cavab verəcəyini proqnozlaşdıra bilər.
model : Bir və ya daha çox ehtimal olunan nəticələri proqnozlaşdırmaq üçün hazırlanmış real dünya hadisəsinin simulyasiyası (adətən kompüterdən istifadə etməklə). Və ya bir şeyin başqalarında necə işlədiyini və ya baxacağını göstərmək üçün nəzərdə tutulmuş bir fərd.
neyron şəbəkəsi : Neyron şəbəkəsi kimi də tanınır. Çoxlu məlumatı və mürəkkəb üsullarla idarə etmək üçün nəzərdə tutulmuş kompüter proqramı. Bu sistemlər kompüter daxilində çoxlu (bəlkə də milyonlarla) sadə, sıx əlaqəli əlaqələrdən ibarətdir. Hər bir əlaqə və ya qovşaq sadə bir əməliyyat həyata keçirə bilər. Bir qovşaq ona məlumat göndərən bir neçə qidalandırıcı qovşaqla birləşdirilə bilər. Başqa bir təbəqədə daha bir neçə qovşaq yeni işlənmiş məlumatları qəbul etməyə və onlara başqa şəkildə hərəkət etməyə hazır vəziyyətdə oturur. Şəbəkələrin ümumi ideyası əvvəlcə sinir hüceyrələrinin beyində düşünməyə və öyrənməyə aparan siqnalları emal etmək üçün işləməsi ilə bağlı idi.
sistem : Bəzi funksiyaları yerinə yetirmək üçün birlikdə işləyən hissələr şəbəkəsi. Məsələn, qan, damarlar və ürək insan bədəninin qan dövranı sisteminin əsas komponentləridir. Eynilə, qatarlar, platformalar, yollar, yol siqnalları və yerüstü keçidlər bir ölkənin dəmir yolu sisteminin potensial komponentləri arasındadır. Sistem hətta hansısa metodun bir hissəsi olan proseslərə və ya ideyalara və ya tapşırığı yerinə yetirmək üçün sifarişli prosedurlar toplusuna tətbiq oluna bilər.
texnologiya : elmi biliklərin praktik məqsədlər üçün, xüsusən sənayedə tətbiqi – və ya bu səylərin nəticəsi olan cihazlar, proseslər və sistemlər.
Sitatlar
Əvvəlcədən çap: M. Lewis və M. Mitchell. Böyük dil modellərində analoji əsaslandırmanın ümumiliyini qiymətləndirmək üçün əks-faktual tapşırıqlardan istifadə . arXiv: 2402.08955. 14 fevral 2024-cü il tarixində təqdim edilmişdir.
Maria Temming haqqında
Maria Temming , Science News Explores -də idarəedici redaktorun köməkçisidir . O, fizika və ingilis dili üzrə bakalavr dərəcəsinə və elm yazısı üzrə magistr dərəcəsinə malikdir.