ChatGPT-ni unudun: niyə tədqiqatçılar indi öz noutbuklarında kiçik AI-lər işlədirlər

Süni intellekt modelləri adətən onlayn istifadə olunur, lakin açıq şəkildə mövcud olan bir sıra alətlər bunu dəyişir. Yerli AI-lərə necə başlamaq olar.
Histo.fyi veb saytı əsas histouyğunluq kompleksi (MHC) molekulları adlanan immun sistemi zülallarının strukturlarının məlumat bazasıdır. Buraya şəkillər, məlumat cədvəlləri və amin turşusu ardıcıllığı daxildir və həmin aktivləri oxunaqlı xülasələrə çevirmək üçün böyük dil modelləri (LLM) adlanan süni intellekt (AI) alətlərindən istifadə edən bioinformatikaçı Chris Thorpe tərəfindən idarə olunur. Lakin o, ChatGPT və ya hər hansı digər veb əsaslı LLM-dən istifadə etmir. Əvəzində Torp öz noutbukunda süni intellektlə işləyir.Elmdə chatbotlar: ChatGPT sizin üçün nə edə bilər?

Son bir neçə il ərzində LLM-lərə əsaslanan chatbotlar şeir yazmaq və ya söhbət etmək qabiliyyətinə görə tərif qazanıblar. Bəzi LLM-lərin yüz milyardlarla parametrləri var – parametrlər nə qədər çox olsa, mürəkkəblik də bir o qədər böyükdür – və yalnız onlayn rejimdə daxil olmaq olar. Ancaq daha iki son tendensiya çiçəkləndi. Birincisi, təşkilatlar LLM-lərin “açıq çəkilər” versiyalarını hazırlayırlar ki, burada model hazırlamaq üçün istifadə olunan çəkilər və qərəzlər ictimaiyyətə açıqdır, belə ki, istifadəçilər hesablama gücü varsa, onları yerli olaraq yükləyə və işlədə bilsinlər. İkincisi, texnologiya firmaları istehlakçı avadanlıqlarında işlədilə bilən və köhnə, daha böyük modellərin performansına rəqib olan kiçildilmiş versiyalar hazırlayır.

Tədqiqatçılar bu cür vasitələrdən pula qənaət etmək, xəstələrin və ya korporasiyaların məxfiliyini qorumaq və ya təkrar istehsal imkanlarını təmin etmək üçün istifadə edə bilərlər. Böyük Britaniyanın Oksford şəhərində yerləşən və Avropa Molekulyar Biologiya Laboratoriyasının Böyük Britaniyanın Hinxton şəhərindəki Avropa Bioinformatika İnstitutunda işləyən Torp alətlərin nə edə biləcəyini araşdıran bir çox tədqiqatçılardan yalnız biridir. Thorpe deyir ki, bu tendensiyanın böyüməsi ehtimalı var. Kompüterlər sürətləndikcə və modellər daha səmərəli olduqca, insanlar getdikcə daha çox öz noutbuklarında və ya mobil cihazlarında ən intensiv ehtiyaclar istisna olmaqla, hamı üçün işləyən AI-lərə sahib olacaqlar. Elm adamları nəhayət ki, əllərində süni intellekt köməkçiləri olacaq – lakin həqiqi alqoritmlər, onlara yalnız uzaqdan daxil olmaq deyil.

Kiçik paketlərdə böyük əşyalar

Bir neçə böyük texnoloji firma və tədqiqat institutu Londonda Google DeepMind daxil olmaqla, son bir neçə il ərzində kiçik və açıq çəkidə modellər buraxdı; Menlo Parkda, Kaliforniyada meta; və Seattle, Vaşinqtondakı Allen Süni İntellekt İnstitutu (bax: “Bəzi kiçik açıq çəki modelləri”). (“Kiçik” nisbidir – bu modellər təxminən 30 milyard parametr ehtiva edə bilər ki, bu da əvvəlki modellərlə müqayisədə böyükdür.)

Bəzi kiçik açıq çəki modelləri

Tərtibatçı	Model	Parametrlər
AI üçün Allen İnstitutu	OLMo-7B	7 milyard
Alibaba	Qwen2-0.5B	0,5 mlrd
alma	DCLM-Baseline-7B	7 milyard
Google DeepMind	Gemma-2-9B	9 milyard
Google DeepMind	CodeGemma-7B	7 milyard
Meta	Llama 3.1-8B	8 milyard
Microsoft	Phi-3-orta-128K-Təlimat	14 milyard
Mistral AI	Mistral-Nemo-Base-2407	12 milyard

Kaliforniya texnoloji firması OpenAI hazırkı GPT modellərini açıqlamasa da, onun Vaşinqtonun Redmond şəhərindəki partnyoru Microsoft 2023-cü ildə Phi-1, Phi-1.5 və Phi-2 kiçik dil modellərini buraxaraq, çılğınlıq içində idi. sonra bu il Phi-3-ün dörd versiyası və Phi-3.5-in üç versiyası. Phi-3 və Phi-3.5 modelləri 3.8 milyard ilə 14 milyard arasında aktiv parametrlərə malikdir və iki model (Phi-3-vision və Phi-3.5-vision) şəkilləri idarə edir ¹ . Bəzi meyarlara görə, hətta ən kiçik Phi modeli belə OpenAI-nin 20 milyard parametrə malik olduğu şayiələrə görə 2023-cü ildən GPT-3.5 Turbo-dan üstündür.

Microsoft-un generativ süni intellekt üzrə vitse-prezidenti Sebastien Bubek Phi-3-ün performansını onun təlim məlumat dəsti ilə əlaqələndirir. LLM-lər əvvəlcə uzun mətn sətirlərində növbəti “token”i (mətn nüsxəsini) proqnozlaşdırmaqla məşq edirlər. Məsələn, bir qətl sirrinin sonunda qatilin adını təxmin etmək üçün süni intellekt əvvəl gələn hər şeyi “başa düşməlidir”, lakin bu cür ardıcıl proqnozlar əksər mətnlərdə nadir hallarda olur. Bu problemi həll etmək üçün Microsoft, bir şeyin digərinin üzərində qurulduğu milyonlarla qısa hekayə və dərslik yazmaq üçün LLM-lərdən istifadə etdi. Bubeck deyir ki, bu mətn üzrə təlimin nəticəsi mobil telefona uyğun gələn, lakin ChatGPT-nin 2022-ci il versiyasının gücünə malik olan modeldir. “Əgər siz bu əsaslandırma əlamətləri ilə çox zəngin olan bir məlumat dəsti hazırlaya bilsəniz, siqnal daha zəngin olacaq” deyir.Elm üçün ChatGPT: məlumatlarınızla necə danışmaq olar

Phi-3 marşrutlaşdırmada da kömək edə bilər – sorğunun daha böyük bir modelə keçib-keçməyəcəyinə qərar vermək. “Bu, Phi-3-ün parlayacağı yerdir” dedi Bubek. Kiçik modellər bulud bağlantısı az olan ucqar bölgələrdəki elm adamlarına da kömək edə bilər. “Burada, Sakit Okeanın şimal-qərbində gəzinti üçün gözəl yerlərimiz var və bəzən sadəcə şəbəkəm yoxdur” deyir. “Və bəlkə də bir çiçəyin şəklini çəkmək və süni intellektimdən bu barədə bəzi məlumat istəmək istəyirəm.”

Tədqiqatçılar xüsusi proqramlar yaratmaq üçün bu alətlər üzərində qura bilərlər. Məsələn, Çin e-ticarət saytı Alibaba, 500 milyondan 72 milyard parametrə qədər Qwen adlı modellər yaratdı. Nyu-Hempşirdəki biotibbi alim, Hugging Face model paylaşma saytında mövcud olan Turbcat-72b yaratmaq üçün elmi məlumatlardan istifadə edərək ən böyük Qwen modelini dəqiqləşdirdi. (Tədqiqatçı Discord mesajlaşma platformasında yalnız Kal’tsit adı ilə çıxış edir, çünki elmdə süni intellektlə aparılan iş hələ də mübahisəlidir.) Kal’tsit deyir ki, o, tədqiqatçılara beyin fırtınası aparmağa, əlyazmaları sübut etməyə, prototip kodunu yaratmağa və ümumiləşdirməyə kömək etmək üçün modeli yaradıb. nəşr olunan məqalələr; model minlərlə dəfə yüklənib.

Məxfiliyin qorunması

Kaltsit deyir ki, fokuslanmış tətbiqlər üçün açıq modelləri dəqiq tənzimləmək qabiliyyətindən başqa, yerli modellərin digər üstünlüyü məxfilikdir. Şəxsi identifikasiya edilə bilən məlumatların kommersiya xidmətinə göndərilməsi məlumatların mühafizəsi qaydalarına zidd ola bilər. “Əgər audit baş versə və siz onlara ChatGPT istifadə etdiyinizi göstərsəniz, vəziyyət olduqca pis ola bilər” deyir.

Hugging Face-də sağlamlıq qrupuna rəhbərlik edən həkim Siril Zakka digər modellər (bəzən yerli də olur) üçün təlim məlumatları yaratmaq üçün yerli modellərdən istifadə edir. Bir layihədə o, tibbi hesabatlardan diaqnozları çıxarmaq üçün onlardan istifadə edir ki, başqa bir model ürək xəstəliklərinin monitorinqi üçün istifadə olunan exokardioqramlar əsasında həmin diaqnozları proqnozlaşdırmağı öyrənə bilsin. Digərində o, digər modelləri sınaqdan keçirmək üçün tibb dərsliklərindən suallar və cavablar yaratmaq üçün modellərdən istifadə edir. “Biz tam avtonom cərrahiyyəyə doğru yol açırıq” deyə izah edir. Suallara cavab vermək üçün öyrədilmiş robot həkimlərlə daha yaxşı ünsiyyət qura bilərdi.

Zakka yerli modellərdən istifadə edir – o, Parisdə Mistral AI texnoloji firması tərəfindən buraxılan Mistral 7B və ya Meta-nın Llama-3 70B modellərinə üstünlük verir – çünki onlar ChatGPT Plus kimi abunə xidmətlərindən daha ucuzdur və onları dəqiq tənzimləyə bilir. Lakin məxfilik də vacibdir, çünki ona xəstələrin tibbi qeydlərini kommersiya AI xidmətlərinə göndərməyə icazə verilmir.AI-ni idarə edən riyaziyyatın içərisində

Missuri ştatının Springfild şəhərindəki Mercy səhiyyə sisteminin endokrinoloqu Conson Tomas da xəstənin məxfiliyi ilə məşğul olur. Klinisyenlərin nadir hallarda xəstə müsahibələrini transkripsiya etmək və ümumiləşdirmək üçün vaxtları olur, lakin bunu etmək üçün AI-dən istifadə edən kommersiya xidmətlərinin əksəriyyəti ya çox bahadır, ya da şəxsi tibbi məlumatları idarə etmək üçün təsdiqlənmir. Beləliklə, Tomas alternativ inkişaf etdirir. OpenAI-dan açıq çəkidə nitqin tanınması modeli olan Whisper-a və Google DeepMind-dən Gemma 2-yə əsaslanan sistem həkimlərə söhbətləri transkripsiya etməyə və onları tibbi qeydlərə çevirməyə, həmçinin tibbi-tədqiqat iştirakçılarının məlumatlarını ümumiləşdirməyə imkan verəcək.

Məxfilik sənayedə də nəzərə alınır. Seulda Cənubi Koreyanın Portrai əczaçılıq şirkətində hazırlanmış CELLama hüceyrənin gen ifadəsi və digər xüsusiyyətləri haqqında məlumatı xülasə cümləyə endirmək üçün Llama 3.1 kimi yerli LLM-lərdən istifadə edir ² . Sonra bu cümlənin ədədi təsvirini yaradır ki, bu da hüceyrələri növlərə bölmək üçün istifadə edilə bilər. Tərtibatçılar GitHub səhifələrində məxfiliyi bir üstünlük kimi vurğulayaraq, CELLama-nın “heç bir məlumat sızmasını təmin etməklə yerli olaraq fəaliyyət göstərdiyini” qeyd edirlər.

Modellərdən yaxşı istifadə etmək

LLM mənzərəsi inkişaf etdikcə, elm adamları sürətlə dəyişən seçimlər menyusu ilə üzləşirlər. Thorpe deyir: “Mən hələ də yerli LLM-lərdən istifadə etmə mərhələsindəyəm. O, ChatGPT-ni sınadı, lakin bunun bahalı olduğunu hiss etdi və onun çıxış tonu düzgün deyildi. İndi o, yerli olaraq 8 milyard və ya 70 milyard parametrə malik Llama-dan istifadə edir, hər ikisi də Mac noutbukunda işləyə bilər.

Thorpe deyir ki, başqa bir üstünlük, yerli modellərin dəyişməməsidir. Kommersiya tərtibatçıları, əksinə, hər an öz modellərini yeniləyə bilər ki, bu da müxtəlif nəticələrə gətirib çıxarır və Thorpe-ni göstərişlərini və ya şablonlarını dəyişdirməyə məcbur edir. “Elmin əksəriyyətində siz təkrarlana bilən şeylər istəyirsiniz” deyə izah edir. “Və yaratdığınız şeyin təkrarlanma qabiliyyətinə nəzarət etmirsinizsə, bu həmişə narahatlıq doğurur.”

Başqa bir layihə üçün Thorpe, MHC molekullarını 3D strukturları əsasında uyğunlaşdıran kod yazır. Alqoritmlərini inkişaf etdirmək və sınaqdan keçirmək üçün ona təbii olaraq mövcud olduğundan daha çox müxtəlif zülallar lazımdır. Etibarlı yeni zülalların dizaynı üçün o, təxminən 50 milyon ^{ardıcıllıqla} öyrədilmiş 738 milyon parametrli açıq çəki modeli olan ProtGPT2- dən istifadə edir .

Ancaq bəzən yerli proqramlar bunu etmir. Kodlaşdırma üçün Thorpe bulud əsaslı GitHub Copilot-dan tərəfdaş kimi istifadə edir. “Mən nədənsə Copilot-dan həqiqətən istifadə edə bilməyəndə qolum kəsilmiş kimi hiss olunur” deyir. Yerli LLM əsaslı kodlaşdırma alətləri (məsələn, Google DeepMind-in CodeGemma və Kaliforniya əsaslı tərtibatçılardan biri Davam et ) mövcuddur, lakin onun təcrübəsinə görə, onlar Copilot ilə rəqabət apara bilmirlər.

Giriş nöqtələri

Beləliklə, yerli LLM-ni necə idarə edirsiniz? Ollama adlı proqram (Mac, Windows və Linux əməliyyat sistemləri üçün mövcuddur) istifadəçilərə Llama 3.1, Phi-3, Mistral və Gemma 2 daxil olmaqla açıq modelləri endirməyə və onlara əmr xətti vasitəsilə daxil olmağa imkan verir. Digər seçimlərə çarpaz platforma proqramı GPT4All və Llamafile daxildir ki , bu proqramlar LLM-ləri qrafik emal vahidi ilə və ya olmadan altı əməliyyat sistemindən hər hansı birində işləyən tək bir fayla çevirə bilir.NatureTech mərkəzi

Massaçusets ştatının Framingham şəhərində yaşayan InfoWorld vebsaytının keçmiş redaktoru Sharon Machlis bir çox variantı əhatə edən LLM-lərdən yerli istifadəyə dair bələdçi yazdı. “Təklif edəcəyim ilk şey,” dedi, “seçdiyiniz proqramın nə qədər skripka çalmaq istədiyiniz səviyyəyə uyğun olmasıdır.” Bəzi insanlar proqramların asanlığına üstünlük verirlər, digərləri isə əmr xəttinin çevikliyinə üstünlük verirlər.

Hansı yanaşmanı seçməyinizdən asılı olmayaraq, yerli LLM-lər tezliklə əksər proqramlar üçün kifayət qədər yaxşı olacaq, San Fransiskodakı Mozilla texnoloji firmasında açıq mənbəli süni intellektə rəhbərlik edən Stiven Hud deyir. “Son bir il ərzində bu sahədə irəliləyişin sürəti heyrətamizdir” dedi.

Bu proqramların nə ola biləcəyinə gəlincə, bu, istifadəçilərin qərarıdır. “Əllərinizi çirkləndirməkdən qorxmayın” deyir Zakka. “Nəticələrdən xoş təəccüblənə bilərsiniz.”

Təbiət 633 , 728-729 (2024)

doi: https://doi.org/10.1038/d41586-024-02998-y

İstinadlar

Abdin, M. et al. Önçap arXiv https://doi.org/10.48550/arXiv.2404.14219 (2024).
Choi, H. et al. bioRxiv https://doi.org/10.1101/2024.05.08.593094 (2024) ünvanında əvvəlcədən çap edin.
Ferruz, N. və b. Təbiət kommunası. 13 , 4348 (2022).Məqalə PubMed Google Alim

İstinadları yükləyin

Download QRPrint QR

Arktikada dinozavrların yanında yuva...

Qədim genomlar Şərqi Asiyada...

Dörd ayaqlı robot insanlarla...

Qida düşmən deyil, dost...

Hüceyrə iskelesinin sirləri açıldı:...

Spektroskopik tədqiqat NGC 3201-də...