#Araşdırmalar və Tədqiqatlar #Xəbərlər

Həyatın bütün sahələri üçün proqnozlaşdırıcı və generativ genomik AI olan Evo 2-ni təqdim edirik

Arc İnstitutu, Stanford Universiteti və NVIDIA-nın tədqiqatçıları genetik variasiyaları proqnozlaşdırmağa və həyatın bütün sahələrində genomik ardıcıllıqlar yarada bilən qabaqcıl süni intellekt modeli olan Evo 2-ni hazırlayıblar.

Test göstərir ki, Evo 2 prokaryotik və eukaryotik genomlardakı mutasiyaların funksional təsirlərini dəqiq proqnozlaşdırır. O, həmçinin birbaşa təlim arayışı olmadan xam genomik ardıcıllıqlardan yunlu mamont genomunu uğurla şərh etdi və funksiyanı yalnız ardıcıllıqla ümumiləşdirmək qabiliyyətini göstərdi.

Mövcud genomik modellər müxtəlif bioloji sistemlərdə, xüsusən də eukaryotik genomlarda mutasiyaların funksional təsirlərini proqnozlaşdırmaqla mübarizə aparır. Maşın öyrənmə yanaşmaları zülal ardıcıllıqlarının və prokaryotik genomların modelləşdirilməsində müəyyən uğur nümayiş etdirdi . Eukaryotik DNT-nin mürəkkəbliyi, uzunmüddətli qarşılıqlı təsirləri və tənzimləyici elementləri ilə daha çox problem yaradır.

Evo 2 bu məhdudiyyətləri həll etmək üçün bakteriyalar, arxeya, eukariotlar və bakteriofaqları əhatə edən geniş miqyaslı təlim məlumat dəstini daxil etməklə, tək bir xüsusi funksiya üçün öyrədilməkdənsə, növlər arasında geniş genomik nümunələrə diqqət yetirməklə hazırlanmışdır.

BioRxiv preprint olaraq nəşr olunan “Evo 2 ilə Həyatın Bütün Sahələrində Genom Modelləşdirməsi və Dizaynı” adlı araşdırmada komanda 9,3 trilyon DNT baza cütü üzərində təlim keçmiş bir modelin genom miqyaslı proqnozlar və dizaynı necə təmin etdiyini ətraflı izah edir.

Evo 2 9,3 trilyon nukleotid (A, T, C və ya G) üzərində məşq etdi və bu, onu indiyə qədər hazırlanmış ən böyük bioloji modellərdən birinə çevirdi. Model eyni vaxtda 1 milyona qədər nukleotidi analiz edə və yarada bilər ki, bu da ona DNT ardıcıllığı daxilində uzunmüddətli nümunələri və əlaqələri tutmağa imkan verir.

https://googleads.g.doubleclick.net/pagead/ads?client=ca-pub-0536483524803400&output=html&h=188&slotname=8188791252&adk=1687169288&adf=4054963813&pi=t.ma~as.8188791252&w=750&abgtt=6&fwrn=4&lmt=1741079944&rafmt=11&format=750×188&url=https%3A%2F%2Fphys.org%2Fnews%2F2025-03-evo-generative-genomic-ai-domains.html&wgl=1&uach=WyJXaW5kb3dzIiwiMTkuMC4wIiwieDg2IiwiIiwiMTMzLjAuNjk0My4xNDIiLG51bGwsMCxudWxsLCI2NCIsW1siTm90KEE6QnJhbmQiLCI5OS4wLjAuMCJdLFsiR29vZ2xlIENocm9tZSIsIjEzMy4wLjY5NDMuMTQyIl0sWyJDaHJvbWl1bSIsIjEzMy4wLjY5NDMuMTQyIl1dLDBd&dt=1741079944069&bpp=1&bdt=246&idt=111&shv=r20250303&mjsv=m202502260101&ptt=9&saldr=aa&abxe=1&cookie=ID%3Df22668bce9793ae4%3AT%3D1735196613%3ART%3D1741079793%3AS%3DALNI_Mb4Xpwl1SO1AcvqroR6xccDm_sheQ&gpic=UID%3D00000f7c5320f40b%3AT%3D1735196613%3ART%3D1741079793%3AS%3DALNI_Mb1dz_DHiT2yDzXLMaB9CDkQl4XGg&eo_id_str=ID%3Dcdf7f2f01784f52d%3AT%3D1735196613%3ART%3D1741079793%3AS%3DAA-Afjb8kbeupLLyQ0QHQmZxpM4v&prev_fmts=0x0&nras=1&correlator=2402307505643&frm=20&pv=1&rplot=4&u_tz=240&u_his=4&u_h=1080&u_w=1920&u_ah=1032&u_aw=1920&u_cd=24&u_sd=1&dmc=8&adx=447&ady=1993&biw=1903&bih=945&scr_x=0&scr_y=0&eid=31090736%2C95344788%2C95352076%2C95354310%2C95354325%2C95354338%2C31090357%2C95350015%2C95353078%2C95353782&oid=2&pvsid=4147347151798126&tmod=707822213&uas=0&nvt=1&ref=https%3A%2F%2Fphys.org%2F&fc=1920&brdim=0%2C0%2C0%2C0%2C1920%2C0%2C1920%2C1032%2C1920%2C945&vis=1&rsz=%7C%7CpeEbr%7C&abl=CS&pfx=0&fu=128&bc=31&bz=1&td=1&tdf=2&psd=W251bGwsbnVsbCxudWxsLDNd&nt=1&ifi=2&uci=a!2&btvi=1&fsb=1&dtd=115

Təlim zamanı Evo 2 dil modellərinin cümlədəki növbəti sözü necə proqnozlaşdırdığına bənzər ardıcıllıqla növbəti baza cütünü proqnozlaşdırmaqla öyrəndi. Bu yanaşma Evo 2-yə kompleks genomik strukturları müəyyən etməyə və həyatın bütün sahələrində genetik variasiyaların funksional təsirini dəqiq modelləşdirməyə imkan verir.

Təlim verilənlər bazası, OpenGenome2, potensial sui-istifadəni azaltmaq üçün eukaryotik hostları yoluxduran virusların genomik ardıcıllığını istisna etmək üçün diqqətlə seçilmişdir.

Funksional genetik elementləri prioritetləşdirən hazırlıq mərhələsi və daha geniş genomik nümunələri ələ keçirmək üçün kontekst uzunluğunu genişləndirən orta təlim mərhələsi ilə başlayan iki fazalı təlim strategiyasından istifadə edilmişdir.

Evo 2, uzun DNT ardıcıllığını miqyasda səmərəli şəkildə idarə etmək üçün optimallaşdırılmış, girişdən asılı konvolyusiya operatorlarını diqqət mexanizmləri ilə birləşdirən yeni bir arxitektura olan StripedHyena 2-dən istifadə edir. Model ənənəvi transformator modelləri ilə müqayisədə daha yüksək effektivliyə nail olmaqla, 40 milyard parametr səviyyəsində 1024 GPU-dan istifadə etməklə öyrədilib.

Nəticələr göstərdi ki, Evo 2, tapşırıq üçün xüsusi incə tənzimləmə ehtiyacı olmadan prokaryotik və eukaryotik genomlardakı mutasiyaların funksional təsirlərini dəqiq proqnozlaşdırır. Model başlanğıc kodonlarında, birləşmə yerlərində və qorunan genomik bölgələrdə mutasiyalara həssaslıq nümayiş etdirdi, performansı məlum bioloji məhdudiyyətlərə uyğunlaşdırdı.

AlphaMissense və GPN-MSA kimi ixtisaslaşdırılmış modellər tək nukleotidli variantların kodlaşdırılmasında bir qədər yaxşı çıxış etdi, halbuki Evo 2 indellər və kodlaşdırılmayan variantlar üçün üstün dəqiqlik nümayiş etdirdi. Evo 2 təqdimatlarında təlim keçmiş yerləşdirməyə əsaslanan təsnifatçılar BRCA1 döş xərçəngi variantlarını təsnif etməkdə ən müasir performansa nail oldular.

Gündəlik anlayışlar üçün Phys.org-a etibar edən 100.000-dən çox abunəçi ilə elm, texnologiya və kosmosda ən son yenilikləri kəşf edin . Pulsuz xəbər bülleteni üçün qeydiyyatdan keçin və mühüm nailiyyətlər, yeniliklər və tədqiqatlar haqqında gündəlik və ya həftəlik yeniləmələr əldə edin .Abunə ol

Şərhin təhlili göstərdi ki, Evo 2 avtonom şəkildə əsas bioloji strukturları, o cümlədən transkripsiya faktorunun bağlanma yerləri, ekson-intron sərhədləri və zülal struktur motivlərini öyrənir.

Seyrək avtokodlayıcı üsulları mobil genetik elementlərə, profaqlara və CRISPR ilə əlaqəli ardıcıllıqlara uyğun gələn gizli xüsusiyyətləri müəyyən etdi. Evo 2-nin ümumiləşdirmə qabiliyyəti, təlim məlumatlarında olmayan bir növ olan yunlu mamont genomunu müvəffəqiyyətlə şərh etməklə nümayiş etdirildi.

Evo 2 uğurla tam mitoxondrial genomları, bakterial genomları və maya xromosom miqyaslı ardıcıllığı yaratmaqla genom miqyaslı ardıcıllığın yaradılması da sınaqdan keçirildi. Yaradılmış ardıcıllıqlar, dəqiq sinteniya nümunələri, zülal kodlaşdırma bölgələri və tənzimləyici elementlər daxil olmaqla, real struktur və təkamül xüsusiyyətləri nümayiş etdirdi.

Mitoxondrial genom ardıcıllığı ilə tələb olunduqda, Evo 2 düzgün sayda kodlaşdıran gen, tRNA və rRNA ilə DNT istehsal etdi.

Ardıcıllığın yaradılmasından başqa, Evo 2 proqramlaşdırıla bilən xromatin əlçatanlığı ilə DNT ardıcıllığını mühəndisləşdirmək üçün nəticə çıxarma zamanı idarə olunan dizayn tapşırığında tətbiq edilmişdir. Enformer və Borzoi kimi xromatin əlçatanlıq modellərini birləşdirən Evo 2 epigenetik strukturlar daxilində Morze kodu mesajlarını kodlaşdırmaq imkanı da daxil olmaqla, spesifik tənzimləyici xüsusiyyətlərə malik ardıcıllıqlar yaratdı.

Evo 2 genom geniş miqyasda proqnozlaşdırma dəqiqliyi ilə generativ imkanları birləşdirərək genomik süni intellektdə əhəmiyyətli irəliləyişi təmsil edir . Evo 2-nin təlim kodunu, model parametrlərini və OpenGenome2 məlumat dəstini açıq şəkildə əlçatan etməklə, tədqiqatçılar genomik tədqiqatları sürətləndirməyə ümid edirlər.

Evo 2-nin gələcək tətbiqlərinə geniş miqyaslı populyasiya genetikası tədqiqatları, sintetik biologiya və qabaqcıl epigenomik dizayn daxil ola bilər.

Daha çox məlumat: Garyk Brixi et al, Evo 2 ilə həyatın bütün sahələrində genom modelləşdirmə və dizayn, bioRxiv (2025). DOI: 10.1101/2025.02.18.638918

Jurnal məlumatı: bioRxiv 

© 2025 Science X Network

Leave a comment

Sizin e-poçt ünvanınız dərc edilməyəcəkdir. Gərəkli sahələr * ilə işarələnmişdir