AI video generatorları San Pedronu xəyal edirmi? Madonna süni intellektin növbəti dalğasını ilk tətbiq edənlər sırasındadır
Madonna hər dəfə konsert turunda 1980-ci illərin hiti olan “La Isla Bonita” mahnısını oxuyanda onun arxasındakı nəhəng arena ekranlarında fırlanan, gün batımı rəngli buludların hərəkətli təsvirləri oynayır.
Bu efirli görünüşü əldə etmək üçün pop əfsanəsi generativ süni intellektin hələ də kəşf edilməmiş qolunu – mətndən videoya aləti qəbul etdi. Bəzi sözlər yazın – məsələn, “surreal bulud qürub” və ya “sübhdə cəngəllikdə şəlalə” – və ani video hazırlanır.
Süni intellekt chatbotlarının və sabit görüntü generatorlarının izi ilə bəzi AI video həvəskarları deyirlər ki, inkişaf etməkdə olan texnologiya bir gün əyləncəni yüksəldə bilər və sizə fərdiləşdirilə bilən hekayə xətləri və sonluqları ilə öz filminizi seçməyə imkan verir. Lakin onların bunu edə bilməsi üçün çox uzun bir yol var və bu yolda çoxlu etik tələlər var.
Uzun müddət sənətin sərhədlərini itələmiş Madonna kimi erkən qəbul edənlər üçün bu, daha çox təcrübə idi. O, tropik əhval-ruhiyyəni oyatmaq üçün daha adi kompüter qrafikasından istifadə edən “La Isla Bonita” konsert vizuallarının əvvəlki versiyasını sildi.
“Biz CGI-ni sınadıq. Olduqca yumşaq və xoşagəlməz görünürdü və o, bəyənmədi” dedi, aprelin sonuna qədər davam edən Madonnanın Bayram Turunun məzmun direktoru Saşa Kasiuha. “Və sonra biz AI-ni sınamağa qərar verdik.”
ChatGPT istehsalçısı OpenAI, şirkət bu yaxınlarda hələ ictimaiyyətə açıqlanmayan yeni alət olan Sora-nı nümayiş etdirəndə mürəkkəb mətndən videoya texnologiyanın necə görünə biləcəyinə nəzər saldı . Madonnanın komandası keçən mart ayında ilk açıq mətndən videoya modelini buraxaraq texnologiyanın öncül olmasına kömək edən Nyu-Yorkda yerləşən Runway startapının fərqli məhsulunu sınadı. Şirkət iyun ayında daha təkmil “Gen-2” versiyasını buraxdı.
https://googleads.g.doubleclick.net/pagead/ads?gdpr=0&us_privacy=1—&gpp_sid=-1&client=ca-pub-0536483524803400&output=html&h=135&slotname=2793866484&adk=675901022&adf=1873531024&pi=t.ma~as.2793866484&w=540&fwrn=4&lmt=1709643689&rafmt=11&format=540×135&url=https%3A%2F%2Ftechxplore.com%2Fnews%2F2024-03-ai-video-generators-san-pedro.html&wgl=1&uach=WyJXaW5kb3dzIiwiMTUuMC4wIiwieDg2IiwiIiwiMTIyLjAuNjI2MS45NSIsbnVsbCwwLG51bGwsIjY0IixbWyJDaHJvbWl1bSIsIjEyMi4wLjYyNjEuOTUiXSxbIk5vdChBOkJyYW5kIiwiMjQuMC4wLjAiXSxbIkdvb2dsZSBDaHJvbWUiLCIxMjIuMC42MjYxLjk1Il1dLDBd&dt=1709623103781&bpp=2&bdt=308&idt=1806&shv=r20240228&mjsv=m202402270101&ptt=9&saldr=aa&abxe=1&cookie=ID%3Dd8c6cdc5123375cd%3AT%3D1709623025%3ART%3D1709643599%3AS%3DALNI_MY2ynj5TDpMXqOZBx7W90OihbbXuw&gpic=UID%3D00000d6971a748b6%3AT%3D1709623025%3ART%3D1709643599%3AS%3DALNI_MaTILJ6PYHOKRZlSvHcKJ4LkDsnLQ&eo_id_str=ID%3D34d5e14efb6a7c5d%3AT%3D1709623025%3ART%3D1709643599%3AS%3DAA-Afjbw5XrDrmZOIEp3UV8fgvCO&prev_fmts=0x0%2C1519x695&nras=2&correlator=6889768145797&frm=20&pv=1&ga_vid=1833901760.1709623018&ga_sid=1709623104&ga_hid=1705718466&ga_fc=1&rplot=4&u_tz=240&u_his=1&u_h=864&u_w=1536&u_ah=816&u_aw=1536&u_cd=24&u_sd=1.25&dmc=8&adx=395&ady=1744&biw=1519&bih=695&scr_x=0&scr_y=0&eid=44759876%2C44759927%2C44759837%2C95322748%2C95325752%2C31081511%2C95322329%2C95324160%2C31078663%2C31078665%2C31078668%2C31078670&oid=2&pvsid=801193083865443&tmod=971840517&uas=0&nvt=1&ref=https%3A%2F%2Ftechxplore.com%2F&fc=1920&brdim=0%2C0%2C0%2C0%2C1536%2C0%2C0%2C0%2C1536%2C695&vis=1&rsz=%7C%7CpeEbr%7C&abl=CS&pfx=0&fu=128&bc=31&bz=0&td=1&psd=W251bGwsbnVsbCwibGFiZWxfb25seV8xIiwxXQ..&nt=1&ifi=2&uci=a!2&btvi=1&fsb=1&dtd=M
Runway-in baş direktoru Cristobal Valenzuela dedi ki, bəziləri bu alətləri “sözü yazdığınız və birtəhər beyninizdə olanı özündə cəmləşdirən sehrli cihaz” kimi görsələr də, ən təsirli yanaşmalar onilliklər köhnəsinə yüksəltmək istəyən yaradıcı mütəxəssislərdir. artıq istifadə etdikləri rəqəmsal redaktə proqramı.
Onun sözlərinə görə, Runway hələ tammetrajlı sənədli film çəkə bilmir. Lakin bu, bəzi arxa plan videosunu və ya b-roll- hekayəni izah etməyə kömək edən dəstəkləyici kadrları və səhnələri doldurmağa kömək edə bilər.
“Bu, bəlkə də bir həftəlik iş kimi sizə qənaət edir” dedi Valenzuela. “Bir çox istifadə hallarının ümumi mövzusu insanların bundan əvvəl edə biləcəkləri bir şeyi artırmaq və ya sürətləndirmək yolu kimi istifadə etməsidir.”
Runway-in hədəf müştəriləri “böyük axın şirkətləri, istehsal şirkətləri, post-produktor şirkətləri, vizual effektlər şirkətləri, marketinq qrupları, reklam şirkətləridir. Dolanmaq üçün məzmun yaradan bir çox insandır” dedi Valenzuela.
Təhlükələr gözləyir. Effektiv qorunma tədbirləri olmadan, AI video generatorları heç vaxt baş verməmiş şeylərin inandırıcı “dərin saxta” videoları ilə demokratiyaları təhdid edə bilər və ya artıq AI görüntü generatorlarında olduğu kimi, interneti real insanlar kimi görünən saxta pornoqrafik səhnələrlə doldura bilər. tanınan simalar. Tənzimləyicilərin təzyiqi altında böyük texnoloji şirkətlər nəyin real olduğunu müəyyən etməyə kömək etmək üçün süni intellekt tərəfindən yaradılan çıxışlara su damğası vurmağa söz verdilər.
Süni intellekt sistemlərinin öyrədildiyi video və şəkil kolleksiyaları (nə Runway, nə də OpenAI öz məlumat mənbələrini açıqlamır ) və onların ticarət nişanlı əsərləri nə dərəcədə ədalətsiz surətdə təkrarladıqları ilə bağlı müəllif hüquqları ilə bağlı mübahisələr də var. Və qorxular var ki, nə vaxtsa video çəkən maşınlar insan işlərini və sənətkarlığı əvəz edə bilər.
Hələlik, süni intellekt tərəfindən yaradılan ən uzun video kliplər hələ də saniyələrlə ölçülür və əyri hərəkətlər və təhrif edilmiş əllər və barmaqlar kimi izahedici xətalara malik ola bilər. 1970-ci illərdən süni intellekt üzərində araşdırma aparan Karnegi Mellon Universitetində kompüter elmləri professoru Alexander Waibel dedi ki, bunun həlli “daha çox məlumat və daha çox təlim məsələsidir” və bu təlimin hansı hesablama gücündən asılıdır.
“İndi mən deyə bilərəm ki, mənə Napoleon paltarı geyinmiş dovşanın Nyu-Yorkda gəzişməsinin videosunu hazırlayın”, – Waibel deyib. “Nyu York şəhərinin necə göründüyünü, dovşanın necə göründüyünü, Napoleonun necə göründüyünü bilir.”
Bu, təsirli olduğunu söylədi, lakin hələ də cəlbedici bir hekayə xətti hazırlamaqdan uzaqdır.
Keçən il ilk nəsil modelini buraxmazdan əvvəl Runway-in süni intellekt şöhrəti iddiası Stable Diffusion görüntü generatorunun birgə tərtibatçısı kimi idi. Başqa bir şirkət, Londonda yerləşən Stability AI, o vaxtdan etibarən Stable Diffusion-un inkişafını öz üzərinə götürdü.
Şəkillər və videoların aparıcı süni intellekt generatorlarının arxasında yatan “diffuziya modeli” texnologiyası səs-küyü və ya təsadüfi məlumatları şəkillərin üzərinə çəkməklə, orijinal təsviri effektiv şəkildə məhv etməklə və sonra yenisinin necə görünəcəyini proqnozlaşdırmaqla işləyir. O, fizikadan, məsələn, qazın xaricə necə yayıldığını təsvir etmək üçün istifadə edilə bilən bir fikir götürür.
Massaçusets Texnologiya İnstitutunun kompüter elmləri üzrə dosenti Phillip Isola, “Diffuziya modellərinin etdiyi şey bu prosesi tərsinə çevirməkdir”. “Onlar bir növ təsadüfiliyi götürürlər və onu yenidən həcmə gətirirlər. Bu, təsadüfilikdən məzmuna keçməyin yoludur. Siz təsadüfi videoları belə edə bilərsiniz.”
https://googleads.g.doubleclick.net/pagead/ads?gdpr=0&us_privacy=1—&gpp_sid=-1&client=ca-pub-0536483524803400&output=html&h=135&slotname=2793866484&adk=675901022&adf=1897700409&pi=t.ma~as.2793866484&w=540&fwrn=4&lmt=1709643721&rafmt=11&format=540×135&url=https%3A%2F%2Ftechxplore.com%2Fnews%2F2024-03-ai-video-generators-san-pedro.html&wgl=1&uach=WyJXaW5kb3dzIiwiMTUuMC4wIiwieDg2IiwiIiwiMTIyLjAuNjI2MS45NSIsbnVsbCwwLG51bGwsIjY0IixbWyJDaHJvbWl1bSIsIjEyMi4wLjYyNjEuOTUiXSxbIk5vdChBOkJyYW5kIiwiMjQuMC4wLjAiXSxbIkdvb2dsZSBDaHJvbWUiLCIxMjIuMC42MjYxLjk1Il1dLDBd&dt=1709623103783&bpp=5&bdt=308&idt=1848&shv=r20240228&mjsv=m202402270101&ptt=9&saldr=aa&abxe=1&cookie=ID%3Dd8c6cdc5123375cd%3AT%3D1709623025%3ART%3D1709643599%3AS%3DALNI_MY2ynj5TDpMXqOZBx7W90OihbbXuw&gpic=UID%3D00000d6971a748b6%3AT%3D1709623025%3ART%3D1709643599%3AS%3DALNI_MaTILJ6PYHOKRZlSvHcKJ4LkDsnLQ&eo_id_str=ID%3D34d5e14efb6a7c5d%3AT%3D1709623025%3ART%3D1709643599%3AS%3DAA-Afjbw5XrDrmZOIEp3UV8fgvCO&prev_fmts=0x0%2C1519x695%2C540x135%2C1005x124&nras=3&correlator=6889768145797&frm=20&pv=1&ga_vid=1833901760.1709623018&ga_sid=1709623104&ga_hid=1705718466&ga_fc=1&rplot=4&u_tz=240&u_his=1&u_h=864&u_w=1536&u_ah=816&u_aw=1536&u_cd=24&u_sd=1.25&dmc=8&adx=395&ady=3567&biw=1519&bih=695&scr_x=0&scr_y=896&eid=44759876%2C44759927%2C44759837%2C95322748%2C95325752%2C31081511%2C95322329%2C95324160%2C31078663%2C31078665%2C31078668%2C31078670&oid=2&psts=AOrYGsmelujnRH6e9ni4pIKT9BFR_EX65cD9TVtivOfGhehjqupvv_X-IuOTs2ojD250HtKKbSX3IPvv54TEPUF3gHVBhIwXklbOxKkTnzBwaNPD%2CAOrYGslEePyE-ZlVhF_HMI93PfMMT2ONCWgfM52VR2GJ1uPtcNQy3jrp4LxVErCoow0s5vl8_UkTDw9Z-ZelVduRLFQ&pvsid=801193083865443&tmod=971840517&uas=3&nvt=1&ref=https%3A%2F%2Ftechxplore.com%2F&fc=1920&brdim=0%2C0%2C0%2C0%2C1536%2C0%2C1536%2C816%2C1536%2C695&vis=1&rsz=%7C%7CpeEbr%7C&abl=CS&pfx=0&fu=128&bc=31&bz=1&td=1&psd=W251bGwsbnVsbCwibGFiZWxfb25seV8xIiwxXQ..&nt=1&ifi=3&uci=a!3&btvi=3&fsb=1&dtd=M
Kompüter Elmləri və Süni İntellekt Laboratoriyasını idarə edən digər MIT professoru Daniela Rus, videonun yaradılması hərəkətsiz şəkillərdən daha mürəkkəbdir, çünki o, müvəqqəti dinamikanı və ya videonun elementlərinin zamanla və kadrların ardıcıllığı üzrə necə dəyişdiyini nəzərə almalıdır.
Rus dedi ki, tələb olunan hesablama resursları “hərəkətsiz görüntü yaratmaq üçün olduğundan xeyli yüksəkdir”, çünki “bu, videonun hər saniyəsi üçün çoxlu kadrların işlənməsini və yaradılmasını nəzərdə tutur”.
Bu, bəzi yaxşı dabanlı texnoloji şirkətlərin daha uzun müddət ərzində yüksək keyfiyyətli AI video istehsalı nümayiş etdirməkdə bir-birindən üstün olmağa çalışmasına mane olmur. Təsvir yaratmaq üçün yazılı təsvirlərin tələb edilməsi yalnız başlanğıc idi. Google bu yaxınlarda bir fotoşəkili və ya hətta eskizi araşdırıla bilən video oyun dünyalarının “sonsuz müxtəlifliyinə” çevirmək üçün təklif oluna bilən Genie adlı yeni layihəni nümayiş etdirdi.
Klivlend Dövlət Universitetinin tədqiqatçısı Aditi Singh, mətni araşdıran Klivlend Dövlət Universitetinin tədqiqatçısı Aditi Singh, yaxın gələcəkdə süni intellekt tərəfindən yaradılan videoların marketinq və təhsil məzmununda görünəcəyini və orijinal görüntülərin istehsalına və ya stok videolarının əldə edilməsinə daha ucuz alternativ olacağını söylədi. video market.
Madonna ilk dəfə öz komandası ilə süni intellekt haqqında danışanda “əsas niyyət “Oh, bax, bu, süni intellektlə bağlı videodur ” deyildi” dedi yaradıcı direktor Kasiuha.
“O, məndən soruşdu ki, ‘Şəkli daha aydın etmək, onun aktual və yüksək ayırdetmə qabiliyyətinə malik olmasına əmin olmaq üçün sadəcə olaraq bu süni intellekt alətlərindən birini istifadə edə bilərsinizmi?'” Kasiuha dedi. “O, yeni texnologiya və yeni vizual elementlər gətirdiyiniz zaman sevir.”
Artıq süni intellektlə yaradılan daha uzun filmlər çəkilir. Runway bu cür əsərləri nümayiş etdirmək üçün hər il AI film festivalına ev sahibliyi edir. Ancaq insan tamaşaçılarının izləmək üçün seçdiyi şeyin olub-olmaması hələ də görünməkdədir.
“Mən hələ də insanlara inanıram” dedi CMU professoru Waibel. “Mən hələ də inanıram ki, bu bir simbioz halına gələcək, burada bəzi AI nəyisə təklif edir və insan onu təkmilləşdirir və ya istiqamətləndirir. Yaxud insanlar bunu edəcək və AI onu düzəldəcək.”
© 2024 Associated Press. Bütün hüquqlar qorunur. Bu material icazəsiz dərc edilə, yayımlana, yenidən yazıla və ya yenidən paylana bilməz.