#Xəbərlər

Süni intellektə əsaslanan təsvirin yenidən hədəflənməsi: Müxtəlif cihazlarda qüsursuz ekran üçün ölçülərin proqnozlaşdırılması

Dərin öyrənmə modellərindən istifadə edərək, Sharjah Universitetinin alimləri müxtəlif ekranlara və ya cihazlara təsvirin kəsilməsi və ölçüsünün dəyişdirilməsi üçün istifadə edilən cari texnologiyalardan daha səmərəli və effektiv şəkildə uyğunlaşmaq üçün uyğun təsvir ölçülərini avtomatik proqnozlaşdırmaq üçün üsullar hazırlayıblar.

Alimlərin araşdırmalarında təklif etdiyi dərin öyrənmə modelləri Resnet18 , DenseNet121 və InceptionV3 kimi köçürmə öyrənmə cihazlarına əsaslanır. Onlar iddia edirlər ki, onların modelləri xüsusi qətnamə ilə daxil olan şəkillər üçün düzgün ölçüləri proqnozlaşdıra bilir.

Əsər IEEE Access jurnalında dərc olunub .

Kompüterlərin meydana çıxması ilə görüntünün yenidən hədəflənməsi geniş tətbiq olunan bir texnikaya çevrildi. O, müxtəlif ekranlara və ya cihazlara sığdırmaq üçün ölçüsü dəyişdirilərkən vizual keyfiyyətlərini və təfərrüatlarını eyni vaxtda qorumaqla, daxil edilmiş təsvirin ölçülərini mahiyyətcə tənzimləyir.

Rəqəmsal cihazların, o cümlədən smartfonların, planşetlərin və kompüterlərin artması, hər bir cihazın xüsusi ekran tələblərinə cavab vermək üçün şəkillərin və videoların ölçülərinə dinamik düzəlişlər etməyi zəruri etdi .

Müxtəlif təsvirin yenidən hədəflənməsi üsulları hazırda mövcuddur və münasibdir və müəlliflər kəsmə (CR), Ölçmə (SCL), tikiş oyma (SC), əyilmə (WARP), Ölçmə və Uzatma (SNS), Çox Operator (MULTI) qeyd edir. , başqaları arasında.

Alimlər şəkillərin avtomatlaşdırılmış şəkildə kəsilməsi və ölçüsünün dəyişdirilməsi üçün cihaz hazırlayırlar
Giriş təsvirində rəng kanalı kimi hədəf ayırdetmənin kodlaşdırılmasının təsviri. Hədəf qətnaməsi beş kanaldan istifadə edərək kodlanır. Hədəf rezolyusiyasına uyğun gələn kanal birlərlə, qalanları isə sıfırlarla doldurulur. Sonra bu kanallar təsvirin dərinliyi ilə birləşdirilir. Model istənilən CNN baza xətti və ya əvvəlcədən hazırlanmış ola bilər. Kredit: IEEE Access (2024). DOI: 10.1109/ACCESS.2024.3510675

Bununla belə, onlar iddia edirlər ki, mövcud texnikalar birbaşa insan nəzarəti olmadan təsvirin ölçüsünü öz-özünə tənzimləmək imkanından məhrumdur, çünki “müxtəlif ekranlar həmin ekran üçün optimallaşdırılmamış şəkillərin kəsilməsinə və ya təhrif edilməsinə səbəb ola biləcək fərqli aspekt nisbətlərinə malikdir”.

https://googleads.g.doubleclick.net/pagead/ads?client=ca-pub-0536483524803400&output=html&h=188&slotname=2793866484&adk=1121470953&adf=3042148327&pi=t.ma~as.2793866484&w=750&abgtt=6&fwrn=4&lmt=1737438368&rafmt=11&format=750×188&url=https%3A%2F%2Ftechxplore.com%2Fnews%2F2025-01-ai-driven-image-retargeting-dimensions.html&wgl=1&uach=WyJXaW5kb3dzIiwiMTkuMC4wIiwieDg2IiwiIiwiMTMxLjAuNjc3OC4yNjYiLG51bGwsMCxudWxsLCI2NCIsW1siR29vZ2xlIENocm9tZSIsIjEzMS4wLjY3NzguMjY2Il0sWyJDaHJvbWl1bSIsIjEzMS4wLjY3NzguMjY2Il0sWyJOb3RfQSBCcmFuZCIsIjI0LjAuMC4wIl1dLDBd&dt=1737438368138&bpp=1&bdt=70&idt=144&shv=r20250114&mjsv=m202501150101&ptt=9&saldr=aa&abxe=1&cookie=ID%3Dfdc40d724f2dca57%3AT%3D1735367325%3ART%3D1737438279%3AS%3DALNI_MYStQ6fUQQQLyo5Z7z1h-XhXcWBtA&gpic=UID%3D00000f80eacffadc%3AT%3D1735367325%3ART%3D1737438279%3AS%3DALNI_MYaOugky0UawScoidzfbXof3-N-iw&eo_id_str=ID%3De43bb863646b60b8%3AT%3D1735367325%3ART%3D1737438279%3AS%3DAA-AfjbQoPwZqH28q9IwcCLRSzzg&prev_fmts=0x0&nras=1&correlator=440828702945&frm=20&pv=1&rplot=4&u_tz=240&u_his=1&u_h=1080&u_w=1920&u_ah=1032&u_aw=1920&u_cd=24&u_sd=1&dmc=8&adx=447&ady=1720&biw=1903&bih=945&scr_x=0&scr_y=0&eid=31089715%2C31089807%2C95344791%2C95350245%2C31089851%2C95347433%2C95340252%2C95340254&oid=2&pvsid=992371817401845&tmod=895593156&uas=0&nvt=1&ref=https%3A%2F%2Fphys.org%2F&fc=1920&brdim=0%2C0%2C0%2C0%2C1920%2C0%2C1920%2C1032%2C1920%2C945&vis=1&rsz=%7C%7CpeEbr%7C&abl=CS&pfx=0&fu=128&bc=31&bz=1&td=1&tdf=2&psd=W251bGwsbnVsbCxudWxsLDNd&nt=1&ifi=2&uci=a!2&btvi=1&fsb=1&dtd=153

Onlar “şəklə və hədəf həllinə əsaslanan ən yaxşı retargeting yanaşmasının qərarının avtomatlaşdırılmasındakı boşluğa” işıq salır və deyirlər ki, onların “araşdırmaları bu boşluğu aradan qaldırmağa çalışır və hansı texnikanın təsviri ən yaxşı şəkildə hədəfə aldığını müəyyən etmək üçün bir model qurmağa çalışır. məlumat itkisini minimuma endirmək və keyfiyyəti qorumaq.”

Müəlliflər hesab edirlər ki, avtomatlaşdırma xüsusi ölçü ilə konkret təsviri hədəf almağın ən yaxşı yoludur. Bu səbəbdən, onlar köçürmə öyrənməsinə əsaslanan dərin öyrənmə modellərini təklif edir və Resnet18, DenseNet121 və InceptionV3 kimi köçürmə öyrənmə cihazlarından “müəyyən bir qətnamə ilə daxil edilmiş təsvir üçün uyğun retargeting metodunu proqnozlaşdırmaq” qabiliyyətinə malik alətlər kimi istifadə edirlər.

Transfer öyrənmə xüsusi tapşırıq üçün xüsusi olaraq qurulmuş modellərin başqa bir tapşırığa uyğun olaraq uyğunlaşdırıldığı maşın öyrənmə üsullarından istifadə edir. Resnet18, DenseNet121 və InceptionV3, təsvirin təfərrüatlarını və strukturunu başa düşmək, təsvirin tanınması və təsnifatı, həmçinin obyektin aşkarlanması və təsvirin seqmentasiyası daxil olmaqla müxtəlif tapşırıqları yerinə yetirmək üçün nəzərdə tutulmuş dərin öyrənmə modelləridir .

Müəlliflər altı kateqoriyaya aid müxtəlif retargeting üsullarından fərqli qətnamələrin 46,716 təsvirindən ibarət verilənlər bazasından istifadə ediblər. Onlar deyirlər ki, “kateqoriyanın üçüncü giriş kimi qidalandığı modellərlə və təsvirdə əlavə kanal kimi kodlaşdırılmış qətnamələrlə təcrübələr keçiriblər.

“Bundan başqa, modellər müxtəlif qiymətləndirmə ölçüləri ilə qiymətləndirilir. Nəticələr 90% ən yaxşı halda F1 balı ilə düzgün retargeting texnikasının seçilməsi üçün təklif olunan yanaşmanın effektivliyini nümayiş etdirdi.”

Alimlər şəkillərin avtomatlaşdırılmış şəkildə kəsilməsi və ölçüsünün dəyişdirilməsi üçün cihaz hazırlayırlar
Təklif olunan həllin arxitekturası əvvəlcədən hazırlanmış onurğanın ötürülməsi öyrənilməsi. Kredit: IEEE Access (2024). DOI: 10.1109/ACCESS.2024.3510675

Müəlliflər öz texnikalarını “optimallaşdırıcı” kimi təqdim edirlər, çünki bu, təsvirin hədəflənməsi tapşırıqlarının proqnozlaşdırılmasını mümkün qədər effektiv və funksional edir. Onlar yazır: “Şəkilləri müxtəlif ekran ölçülərinə və aspekt nisbətlərinə uyğunlaşdırmaq üçün optimallaşdırmaqla, onların müxtəlif cihazlarda düzgün göstərilməsini və ekran ölçüsü və ya aspekt nisbəti fərqlərindən asılı olmayaraq yaxşı görünməsini təmin edə bilərik.

“Dərin öyrənmə tez bir zamanda təsvirin yenidən hədəflənməsi üsullarını təsnif etmək üçün əsas üsullardan birinə çevrildi, çünki onun imkanları şəkillərdən xüsusiyyətləri avtomatik çıxarmağa və bütün mürəkkəb əlaqələri effektiv şəkildə tutmağa imkan verir.”

Müəlliflər “şəklin yenidən hədəflənməsi üsullarının avtomatik identifikasiyası üçün yeni köçürmə öyrənmə modelləri” kimi təsvir etdiklərini təqdim edirlər. Biz əsas CNN, Resnet18, DenseNet121 və InceptionV3 kimi bir neçə modeldən istifadə etdik. Modellər müxtəlif qiymətləndirmə ölçülərindən istifadə etməklə qiymətləndirilir və nəticələr modellərin ən yaxşı retargeting metodunu seçmək üçün nə qədər effektiv olduğunu göstərir.”

Müəlliflər yeni təsviri yenidən hədəfləmə üsullarının kommersiya baxımından nə vaxt əldə olunacağını gözlədiklərini qeyd etmirlər, lakin onlar “ən yaxşı texnikanı seçən və təsviri tam avtomatik yanaşmada tələb olunan qətnaməyə çatdıran modeli inkişaf etdirmək üçün əlavə araşdırmalara ehtiyac olduğunu vurğulayırlar. “

Bundan əlavə, onlar “bir çox istifadə hallarını ümumiləşdirə bilən daha dəqiq və dəqiq bir model təmin etmək üçün əlavə nümunələr və əlavə retargeting üsulları ilə şərh edilmiş məlumat dəstini genişləndirməyi planlaşdırırlar.”

Daha çox məlumat: Mohammad Alsmirat et al, Image Retargeting Techniques İdeal İdentifikasiyası üçün Nəzarət Edilən Dərin Öyrənmə, IEEE Access (2024). DOI: 10.1109/ACCESS.2024.3510675

Jurnal məlumatı: IEEE Access 

Leave a comment

Sizin e-poçt ünvanınız dərc edilməyəcəkdir. Gərəkli sahələr * ilə işarələnmişdir