Həyat kodunu sındırmaq: Yeni AI modeli DNT-nin gizli dilini öyrənir
DNT həyatı davam etdirmək üçün lazım olan əsas məlumatları ehtiva edir. Bu məlumatın necə saxlanıldığını və təşkil olunduğunu anlamaq ötən əsrin ən böyük elmi problemlərindən biri olmuşdur.
İnsan DNT-si üzərində öyrədilmiş yeni böyük dil modeli olan GROVER ilə tədqiqatçılar indi genomumuzda gizlənən mürəkkəb məlumatı deşifrə etməyə cəhd edə bilərlər.
Drezden Texnologiya Universitetinin Biotexnologiya Mərkəzində (BIOTEC) bir komanda tərəfindən hazırlanmış GROVER insan DNT-sini mətn kimi qəbul edir, DNT ardıcıllığı haqqında funksional məlumat çəkmək üçün onun qaydalarını və kontekstini öyrənir. Nature Machine Intelligence -də nəşr olunan bu yeni alət genomikanı dəyişdirmək və fərdiləşdirilmiş təbabəti sürətləndirmək potensialına malikdir.
İkiqat spiral kəşf edildikdən sonra elm adamları DNT-də kodlanmış məlumatları anlamağa çalışdılar. 70 il sonra DNT-də gizlənən məlumatların çoxqatlı olduğu aydın olur. Genomun yalnız 1-2%-i zülalları kodlayan genlərdən ibarətdir.
“DNT-nin zülalların kodlaşdırılmasından başqa bir çox funksiyası var. Bəzi ardıcıllıqlar genləri tənzimləyir, digərləri struktur məqsədlərə xidmət edir, əksər ardıcıllıqlar eyni vaxtda birdən çox funksiyaya xidmət edir. Hazırda biz DNT-nin əksəriyyətinin mənasını anlamırıq. Söhbət qeyri-müəyyən olanı anlamaqdan gedir. -DNT bölgələrinin kodlaşdırılması, deyəsən, biz yalnız səthi cızmağa başlamışıq, burada AI və böyük dil modelləri kömək edə bilər,” BIOTEC-in tədqiqat qrupunun rəhbəri Dr. Anna Poetsch deyir.
DNT bir dil olaraq
GPT kimi böyük dil modelləri dil anlayışımızı dəyişdirdi. Yalnız mətn üzərində təlim keçmiş böyük dil modelləri dildən bir çox kontekstdə istifadə etmək bacarığını inkişaf etdirmişdir.
https://googleads.g.doubleclick.net/pagead/ads?gdpr=0&us_privacy=1—&gpp_sid=-1&client=ca-pub-0536483524803400&output=html&h=135&slotname=2793866484&adk=675901022&adf=1873531024&pi=t.ma~as.2793866484&w=540&abgtt=6&fwrn=4&lmt=1722869722&rafmt=11&format=540×135&url=https%3A%2F%2Ftechxplore.com%2Fnews%2F2024-08-code-life-ai-dna-hidden.html&wgl=1&uach=WyJXaW5kb3dzIiwiMTAuMC4wIiwieDg2IiwiIiwiMTI3LjAuNjUzMy44OSIsbnVsbCwwLG51bGwsIjY0IixbWyJOb3QpQTtCcmFuZCIsIjk5LjAuMC4wIl0sWyJHb29nbGUgQ2hyb21lIiwiMTI3LjAuNjUzMy44OSJdLFsiQ2hyb21pdW0iLCIxMjcuMC42NTMzLjg5Il1dLDBd&dt=1722868816407&bpp=3&bdt=1505&idt=734&shv=r20240731&mjsv=m202407290101&ptt=9&saldr=aa&abxe=1&cookie=ID%3D3b199fcd67477665%3AT%3D1722782760%3ART%3D1722868642%3AS%3DALNI_MYiVAjEyy4dUxgOksNR26c7Dw2QPA&eo_id_str=ID%3Dd042eab5cd0e9128%3AT%3D1722782760%3ART%3D1722868642%3AS%3DAA-AfjaezaeceO7ROnaS-eCO7629&prev_fmts=0x0&nras=1&correlator=7738335868489&frm=20&pv=1&ga_vid=1057348607.1721801883&ga_sid=1722868817&ga_hid=180240426&ga_fc=1&rplot=4&u_tz=240&u_his=1&u_h=900&u_w=1440&u_ah=860&u_aw=1440&u_cd=24&u_sd=1&dmc=8&adx=347&ady=1746&biw=1423&bih=739&scr_x=0&scr_y=0&eid=44759875%2C44759926%2C44759842%2C31085555%2C31085665%2C95331832%2C95334525%2C95334829%2C95337869%2C95338227%2C31084185%2C95339222%2C95336267%2C31078663%2C31078665%2C31078668%2C31078670&oid=2&pvsid=2387880456824246&tmod=398566582&uas=0&nvt=1&ref=https%3A%2F%2Fphys.org%2F&fc=1920&brdim=0%2C0%2C0%2C0%2C1440%2C0%2C0%2C0%2C1440%2C739&vis=1&rsz=%7C%7CpeEbr%7C&abl=CS&pfx=0&fu=128&bc=31&bz=0&td=1&tdf=0&psd=W251bGwsbnVsbCwibGFiZWxfb25seV80IiwxXQ..&nt=1&ifi=2&uci=a!2&btvi=1&fsb=1&dtd=M
“DNT həyatın kodudur. Niyə ona bir dil kimi yanaşmayaq?” Doktor Poetsch deyir. Poetsch komandası istinad insan genomu üzərində böyük bir dil modeli hazırladı . GROVER adlı nəticə aləti və ya “Çıxarılan Nümayəndəliklər Yoluyla Alınan Genom Qaydaları” DNT-dən bioloji məna çıxarmaq üçün istifadə edilə bilər.
“GROVER DNT qaydalarını öyrəndi. Dil baxımından söhbət qrammatika, sintaksis və semantikadan gedir. DNT üçün bu, ardıcıllıqları tənzimləyən qaydaları, nukleotidlərin və ardıcıllıqların sırasını, ardıcıllıqların mənasını öyrənmək deməkdir. İnsan dillərini öyrənən GPT modelləri kimi , GROVER əsasən DNT-ni necə “danışmağı” öyrəndi” deyə layihənin arxasında duran tədqiqatçı Dr. Melissa Sanabria izah edir.
Komanda göstərdi ki, GROVER yalnız aşağıdakı DNT ardıcıllıqlarını dəqiq proqnozlaşdıra bilməz, həm də bioloji məna daşıyan kontekstual məlumatı çıxarmaq üçün də istifadə edilə bilər, məsələn, DNT-də gen promotorlarını və ya zülal bağlama yerlərini müəyyən etmək. GROVER həmçinin ümumiyyətlə “epigenetik” hesab edilən prosesləri, yəni kodlaşdırılmaq əvəzinə DNT-nin üstündə baş verən tənzimləyici prosesləri öyrənir.
“Maraqlıdır ki, GROVER-i yalnız DNT ardıcıllığı ilə, heç bir funksiya qeydləri olmadan öyrətməklə, biz əslində bioloji funksiya haqqında məlumat çıxara bilirik . Bizim üçün bu, funksiyanın, o cümlədən bəzi epigenetik məlumatların da kodlaşdırıldığını göstərir. ardıcıllıqla” Dr. Sanabria deyir.
DNT lüğəti
“DNT dilə bənzəyir. Onun ardıcıllıqlar yaradan dörd hərfi var və ardıcıllıqlar bir məna daşıyır. Bununla belə, bir dildən fərqli olaraq, DNT-də müəyyən edilmiş sözlər yoxdur”, – Dr Poetsch deyir. DNT dörd hərfdən (A, T, G və C) və genlərdən ibarətdir, lakin genlər və ya digər mənalı ardıcıllıqlar yaratmaq üçün birləşən müxtəlif uzunluqlarda əvvəlcədən müəyyən edilmiş ardıcıllıqlar yoxdur.
GROVER-i öyrətmək üçün komanda əvvəlcə DNT lüğəti yaratmalı idi. Onlar sıxılma alqoritmlərindən bir hiylə istifadə etdilər. “Bu addım çox vacibdir və bizim DNT dil modelimizi əvvəlki cəhdlərdən fərqləndirir”, – Dr Poetsch deyir.
“Biz bütün genomu təhlil etdik və ən çox rast gəlinən hərf birləşmələrini axtardıq. Biz iki hərflə başladıq və DNT-ni təkrar-təkrar nəzərdən keçirdik və onu ən çox yayılmış çox hərf birləşmələrinə çatdırdıq. Bu yolla, təqribən 600 sikl ərzində biz DNT-ni “sözlərə” parçaladıq ki, bu da növbəti ardıcıllığı proqnozlaşdırmaqda GROVER-ə ən yaxşı performansı göstərməyə imkan verir”, – deyə Dr. Sanabria izah edir.
Genomikada AI vədi
GROVER genetik kodun müxtəlif təbəqələrini açmağı vəd edir. DNT bizi insan edən şeylər, xəstəliklərə meylimiz və müalicələrə cavablarımız haqqında əsas məlumatları saxlayır.
“Biz inanırıq ki, DNT qaydalarını dil modeli vasitəsilə anlamaq bizə DNT-də gizlənmiş bioloji mənanın dərinliklərini açmağa kömək edəcək, həm genomikanı, həm də fərdiləşdirilmiş təbabəti inkişaf etdirəcək”, – Dr Poetsch deyir.
Daha çox məlumat: Melissa Sanabria və başqaları, DNT dil modeli GROVER insan genomunda ardıcıllıq kontekstini öyrənir, Nature Machine Intelligence (2024). DOI: 10.1038/s42256-024-00872-0
Jurnal məlumatı: Nature Machine Intelligence Drezden Texnologiya Universiteti tərəfindən təmin edilmişdir