#Araşdırmalar və Tədqiqatlar #Xəbərlər

22 dildə universal nümunələr ortaya çıxır və lüğətlərin necə inkişaf etdiyini göstərir.

İnqrid Fadelli , Phys.org tərəfindən

redaktə edən: Gaby Clark , rəy verən: Robert Egan

 Redaktorların qeydləri

 GIST

Tercih edilən mənbə kimi əlavə edin


Çox istifadə olunan sözlər digər çox istifadə olunan sözlərə daha yaxın qalır və semantik cəhətdən populyar bölgələri müəyyən edir. Solda: intuitiv cizgi filmi. Sağda: Word2vec və wordfreq məlumat dəstlərindən istifadə edərək hesablanmış səpələnmə qrafikləri. Müəllif: Guo və digərləri (Proceedings B, 2026).

İnsan dillərinin tarix boyu xeyli böyüdüyü və dəyişdiyi, çox vaxt texnoloji, mədəni və ictimai dəyişiklikləri əks etdirdiyi məlumdur. Beləliklə, dillərin təkamülünü öyrənmək insan cəmiyyətlərinin və mədəniyyətlərinin zamanla necə dəyişdiyinə dair dəyərli məlumatlar verə bilər.

https://0b2bd45280748b074a7aefdbab2e6d18.safeframe.googlesyndication.com/safeframe/1-0-45/html/container.html

Fudan, Harvard və Stony Brook Universitetlərinin tədqiqatçıları bu yaxınlarda süni intellekt (Sİ) alətləri, statistik metodlar və real dilçilik məlumatlarının böyük bir ehtiyatından istifadə edərək 22 dilin təkamülünü araşdırdılar. Onların ” Proceedings of the Royal Society B Biological Sciences” jurnalında dərc olunmuş məqaləsində araşdırdıqları bütün dillər üçün ortaq statistik struktur və onların təkamülünün əsasını təşkil edən qanunauyğunluqlar müəyyən edilmişdir.

“Yeni sözlər, anlayışlar və ideyalar daim yaranır, amma hansı anlayışların ortaya çıxma ehtimalını idarə edən gizli nümunələr mövcuddurmu? Bu prosesi təqlid edən sadə riyazi modellər varmı?”, məqalənin baş müəllifi Stiven Skiena Phys.org-a bildirib. “Dil semantikasını (söz daxiletmələri) təmsil etmək üçün maşın öyrənmə texnologiyalarının insan dilinin təmin etdiyi mürəkkəb material haqqında ciddi şəkildə düşünmək üçün bizə bir yol verməsi ideyasından ilham aldıq.”

Dilin təkamülünün köhnə və yeni metodlarla öyrənilməsi

İnsan dillərinin və mədəniyyətlərinin təkamülünü öyrənmək üçün Skiena və həmkarları mətnləri və ya nitqi təhlil etmək üçün hazırlanmış təbii dil emalı (NLP) metodlarından, alqoritmlərdən istifadə etdilər. Bu modellər sözdə söz birləşmələrindən istifadə edərək sözləri təmsil edir.

Söz daxiletmələri, hər bir lüğət sözünü yüksək ölçülü semantik məkanda müəyyən bir nöqtə ilə əlaqələndirən sözlərin ədədi təsvirləridir. Bu məkanda oxşar mənalara malik sözlər yaxın nöqtələr kimi təmsil olunur.

https://0b2bd45280748b074a7aefdbab2e6d18.safeframe.googlesyndication.com/safeframe/1-0-45/html/container.html

Skiena izah etdi: “Əslində, məqaləmizdə müxtəlif dillərin lüğət ehtiyatının bu xüsusiyyət sahəsində necə paylandığı və oxşar paylanmanı hansı riyazi prosesin yaradacağı soruşulur. Məqaləmiz inanılmaz dərəcədə uzun bir müddət çəkdi: bu mərhələdə yeddi ildən çoxdur ki, birlikdə bu mövzu üzərində işləyirik və nəhayət hara çatdığımızı görmək çox xoşdur.”

Tədqiqatçılar ingilis və 21 başqa dildə sözləri ehtiva edən böyük məlumat dəstlərindən istifadə etmiş, sonra bu sözləri söz daxiletmələri kimi təqdim etmişlər. Bu, onlara mənalarını riyazi olaraq xəritələşdirməyə və bir-biri ilə necə əlaqəli olduqlarını göstərən qanunauyğunluqlar axtarmağa imkan vermişdir.

Məqalənin həmmüəllifi Sergiy Verstyuk izah etdi: “Biz orta əsrlərə qədər uzanan linqvistik məlumatları və kəmiyyət coğrafiyası və ətraf mühit elmlərində məşhur olan məkan statistikasından metodlar kimi kifayət qədər tanınmış alətləri çox müasir ML və NLP texnikaları ilə birləşdirdik. Bu, bizə bu gün və tariximiz boyunca bir çox müxtəlif insan dilləri üçün doğru olan mədəniyyət haqqında bəzi faktları aşkar etməyə imkan verdi.”

Maraqlıdır ki, Skiena, Verstyuk və həmkarları təhlil etdikləri 22 dilin sistematik şəkildə bəzi universal qanunauyğunluqları paylaşdığını aşkar etdilər. Birincisi, onlar məşhur sözlərin ardıcıl olaraq digər populyar sözlərlə qruplaşdırıldığını və yüksək tezlikli sözlərin “populyar” bölgələrini yaratdığını aşkar etdilər.

Tədqiqatçılar həmçinin söz qruplaşdırma sürəti üçün ortaq profillər aşkar etdilər. Başqa sözlə desək, onlar lüğət sözlərinin iyerarxik bir şəkildə təşkil olunduğunu və bu iyerarxiyanın strukturunun təhlil edilən bütün dillərdə ümumilikdə eyni olduğunu aşkar etdilər.

Skiena bildirib ki, “Biz həmçinin maraqlı zaman dinamikasını müşahidə etdik və yeni sözlərin ümumiyyətlə ətraflarındakı digər yeni sözlərlə birlikdə partlayış şəklində yaradıldığını göstərdik. Bu, bioloji təkamülün əhəmiyyətli genetik və ya morfoloji dəyişikliklərin sürətli dövrlərində necə baş verdiyini bir qədər xatırladır.”

Bundan əlavə, onlar əvvəlcə ekoloji icmalar üçün kəşf edilmiş və sonradan digər bioloji nümunələrdə, fiziki məlumatlarda və riyazi obyektlərdə müəyyən edilmiş sözdə Teylor qanununun lüğət sözləri üçün də keçərli olduğunu aşkar etdilər. Bu halda, bu, semantik mənası və tarixi görünüşünə görə sıralanmış söz saylarının orta və dəyişkənliyini birləşdirən riyazi əlaqənin güc qanunu növüdür ki, bu da bizə dilin semantikasını və təkamülünü eyni vaxtda anlamağa imkan verir.

Gündəlik məlumat üçün Phys.org-a etibar edən 100.000-dən çox abunəçi ilə elm, texnologiya və kosmosdakı ən son yenilikləri kəşf edin . Pulsuz bülletenimizə abunə olun və vacib olan nailiyyətlər, innovasiyalar və tədqiqatlar haqqında gündəlik və ya həftəlik yeniliklərdən xəbərdar olun .

Dilin təkamülünü anlamaq üçün növbəti addımlar

Bu tədqiqat, müxtəlif dillərin son əsrlər ərzində necə təkamül etdiyinə və onlar arasında çoxsaylı oxşarlıqlara dair bəzi maraqlı yeni məlumatlar təqdim edir. Ümumilikdə, aşkar etdikləri statistik nümunələr insan dillərinin daha dərindən başa düşülməsi üçün nəticələrə səbəb ola bilər. Daha da əhəmiyyətlisi, insan mədəniyyətinin digər sahələrində də oxşar nümunələr nümayiş etdirildiyinə dair bəzi dəlillər mövcuddur.

Komandanın təhlilləri onlara oxşar xüsusiyyətlərə malik söz dəstləri yaradan stoxastik riyazi prosesi müəyyən etməyə imkan verdi. Bu proses insan dillərinin hansı mexanizmlər vasitəsilə yaradıldığını və zamanla necə inkişaf etdiyini qismən izah edə bilər.

Verstyuk dedi: “Biz təəccüblü dərəcədə sadə bir model qurduq ki, bu model söz tezliklərinin güc qanunu paylanması üzrə əvvəlki nəticələri təkrarlamaqla yanaşı (yəni, tək bir ölçüdə özünü göstərir), həm də bir çox əlavə ölçülərdə (xüsusən də 300 ölçülü semantik məkanda və tarixi zaman daxilində) yeni empirik tapıntıları da nəzərə alır. Bu, tanınmış kümülatif üstünlük prosesini nadir hallarda istifadə edilən fon Mizes-Fişer ehtimal paylanması ilə birləşdirməklə əldə edildi.”

Gələcəkdə bu iş NLP metodlarından və digər süni intellekt (Sİ) alətlərindən, eləcə də formal riyazi modelləşdirmədən istifadə edən daha çox dilçilik və antropoloji tədqiqatlara ilham verə bilər. Skiena əlavə edib ki, “Sİ tərəfindən yaradılan inteqrasiyaların yalnız texnoloji alətlər qurmaq üçün deyil, mədəni təkamüldəki tarixi prosesləri anlamaqda fundamental tədqiqatlar üçün bir vasitə kimi istifadəsinin imkanları bizi həyəcanlandırır”.

Müəllifimiz İnqrid Fadelli tərəfindən sizin üçün yazılmış, Qeb Klark tərəfindən redaktə edilmiş və Robert İqan tərəfindən faktlar yoxlanılmış və nəzərdən keçirilmiş bu məqalə diqqətli insan əməyinin nəticəsidir. Müstəqil elmi jurnalistikanı yaşatmaq üçün sizin kimi oxuculara güvənirik. Əgər bu reportaj sizin üçün vacibdirsə, xahiş edirik ianə etməyi (xüsusilə aylıq) nəzərdən keçirin. Təşəkkür olaraq reklamsız hesab əldə edəcəksiniz .

Daha çox məlumat

Xingzhi Guo və digərləri, Statistik struktur və dillərin təkamülü, Kral Cəmiyyətinin B Bioloji Elmlər üzrə materialları (2026). DOI: 10.1098/rspb.2025.2374 .

© 2026 Science X Network

Leave a comment

Sizin e-poçt ünvanınız dərc edilməyəcəkdir. Gərəkli sahələr * ilə işarələnmişdir