NVIDIA-nın yeni süni intellekt aləti 3D səhnələri və fotorealistik şəkilləri dəqiq redaktə etməyə imkan verir.

Ingrid Fadelli , Phys.org
Lisa Lock tərəfindən redaktə edilmişdir , Andrew Zinin tərəfindən nəzərdən keçirilmişdir
Redaktorların qeydləriDiffusionRenderer-in həndəsə təxminlərinin nümunələrini və model tərəfindən yaradılmış xüsusi işıqlandırma şəraiti ilə fotorealistik şəkilləri göstərən şəkil. Kredit: Liang və digərləri, NVIDIA
Keçən illər ərzində kompüter alimləri xüsusi giriş və ya göstərişlərdən sonra fərdiləşdirilmiş məzmun yarada bilən getdikcə daha təkmilləşmiş generativ AI modellərini təqdim etdilər. Şəkil yaratma modelləri indi geniş şəkildə istifadə olunsa da, onların bir çoxu gözlənilməzdir və yaratdıqları şəkillərə dəqiq nəzarət etmək problem olaraq qalır.
İyunun 11-15-də Neşvildə keçirilən Kompüter Görmə və Nümunələrin Tanınması üzrə builki Konfransda ( CVPR 2025 ) təqdim olunan son məqalədə NVIDIA tədqiqatçıları şəkillərin yaradılması və redaktəsini inkişaf etdirə bilən, istifadəçilərə xüsusi təsvir atributlarını dəqiq tənzimləməyə imkan verən yeni maşın öyrənmə yanaşması olan DiffusionRenderer-i təqdim etdilər.
“General süni intellekt vizual yaradıcılıqda böyük irəliləyişlər əldə edib, lakin o, klassik qrafikadan fərqlənən və hələ də idarəolunma qabiliyyəti ilə mübarizə aparan tamamilə yeni yaradıcı iş axını təqdim edir”, – NVIDIA-da süni intellekt üzrə tədqiqatlar üzrə vitse-prezidenti və Məkansal intellekt laboratoriyasının rəhbəri Sanja Fidler Tech Xplore-a bildirib.
“DiffusionRenderer ilə biz ənənəvi qrafik boru kəmərlərinin dəqiqliyini süni intellektin çevikliyi ilə birləşdirərək bu boşluğu aradan qaldırmaq istədik. Məqsədimiz daha əlçatan, idarə oluna bilən və mövcud alətlərlə asanlıqla inteqrasiya olunmaq üçün növbəti nəsil renderi araşdırmaq və dizayn etməkdir.”
Fidler və onun həmkarları tərəfindən təqdim edilən yeni yanaşma fərdi iki ölçülü (2D) videoları qrafika uyğun səhnə təsvirlərinə çevirə bilər. Qeyd etmək lazımdır ki, o, həmçinin istifadəçilərə nümayəndəliklərdə işıqlandırma və materialları tənzimləməyə, ehtiyac və üstünlüklərinə uyğun yeni məzmun istehsal etməyə imkan verir.Oyna
00:00
00:04SəssizParametrlərPIPTam ekrana daxil olun
“DiffusionRenderer böyük bir irəliləyişdir, çünki o, eyni vaxtda kompüter qrafikasında iki uzunmüddətli problemi həll edir – real dünya videolarından həndəsə və materialları çəkmək üçün tərs göstərmə və səhnə təsvirlərindən fotoreal şəkillər və videolar yaratmaq üçün irəli göstərmə”.
“DiffusionRenderer-in ən maraqlı nailiyyətlərindən biri odur ki, o, generativ AI-ni qrafik iş axınlarının əsasına gətirir və aktivlərin yaradılması, işıqlandırma və materialların redaktəsi kimi ənənəvi vaxt aparan vəzifələri daha səmərəli etməklə onu tamamlayır.”
Tədqiqatçılar tərəfindən təqdim edilən yeni neyron göstərmə yanaşması diffuziya modellərinə, təsadüfi səs-küyü tədricən ardıcıl qrafiklərə uyğunlaşdıraraq şəkillər yarada bilən dərin öyrənmə alqoritmləri sinfinə əsaslanır. Keçmişdə tətbiq edilən digər təsvir yaratma üsullarından fərqli olaraq, DiffusionRenderer əvvəlcə G-buferləri (yəni, xüsusi atributları əks etdirən ara təsvir təsvirləri) istehsal etməklə və sonra yeni və real təsvirlər yaratmaq üçün bu təsvirlərdən istifadə etməklə işləyir.
“Biz həmçinin modelin səhnələri real şəkildə parçalamağı və yenidən qurmağı öyrənməsinə kömək etmək üçün dəqiq işıqlandırma və materiallara malik yüksək keyfiyyətli sintetik verilənlər toplusunun yaradılmasında əldə etdiyimiz irəliləyişlə fəxr edirik” dedi Fidler. “Biz aşkar etdik ki, keyfiyyət əsas video diffuziya modelinin ölçüsü ilə ölçülür, yəni NVIDIA Cosmos ilə inteqrasiya etdikdə nəticələr daha da kəskin və ardıcıl olur.”Oyna
00:04
00:05SəssizParametrlərPIPTam ekrana daxil olun
Gələcəkdə DiffusionRenderer həm robototexnika tədqiqatçıları, həm də yaradıcı mütəxəssislər tərəfindən istifadə edilə bilər. Məsələn, bu, video oyunları, reklamlar və ya filmlər istehsal edən məzmun yaradıcıları üçün dəyərli ola bilər, çünki bu, onlara yüksək dəqiqliklə xüsusi atributları əlavə etmək, silmək və ya redaktə etmək imkanı verir. O, həmçinin robototexnika və ya təsvirin təsnifatı üçün alqoritmləri hazırlamaq üçün fotorealistik məlumatlar yaratmaq üçün kompüter alimləri tərəfindən istifadə edilə bilər .
“Onun digər böyük təsiri simulyasiya və fiziki süni intellektdə ola bilər – robototexnika və AV təlimi mümkün olan ən müxtəlif məlumat dəstlərinə ehtiyac duyur və DiffusionRenderer yeni səhnələrdən yeni işıqlandırma şəraiti yarada bilər”, – Fidler əlavə edib. “Biz bu məkanda sərhədləri itələməyə davam etməkdən məmnunuq.
“Gələcək işimiz daha yüksək keyfiyyətli nəticələrin yaradılmasına, iş vaxtının səmərəliliyinin artırılmasına və semantik nəzarət, obyektlərin birləşdirilməsi və daha təkmil redaktə alətləri kimi daha güclü funksiyaların əlavə edilməsinə yönəlib.”
Müəllifimiz İnqrid Fadelli tərəfindən sizin üçün yazılmış , Liza Lok tərəfindən redaktə edilmiş və Endryu Zinin tərəfindən yoxlanılmış və nəzərdən keçirilmiş bu məqalə diqqətli insan əməyinin nəticəsidir. Müstəqil elmi jurnalistikanı yaşatmaq üçün sizin kimi oxuculara güvənirik. Bu hesabat sizin üçün əhəmiyyət kəsb edirsə, lütfən, ianə (xüsusilə aylıq) nəzərdən keçirin. Siz təşəkkür olaraq reklamsız hesab əldə edəcəksiniz .
Ətraflı məlumat: DiffusionRenderer: Video diffuziya modelləri ilə neyron tərs və irəli göstərmə. arXiv:2501.18590 [cs.CV]. arxiv.org/abs/2501.18590
Research.nvidia.com/labs/toron … i/DiffusionRenderer/
© 2025 Science X Network