#Araşdırmalar və Tədqiqatlar #Xəbərlər

Tədqiqatçılar erkən müasir mətn transkripsiyasını etik cəhətdən avtomatlaşdırmaq üçün maşın öyrənməsini araşdırırlar

Çikaqo Universiteti tərəfindən

Gaby Clark tərəfindən redaktə edilmişdir , Andrew Zinin tərəfindən nəzərdən keçirilmişdir

 Redaktorların qeydləriKredit: Unsplash/CC0 Public Domain

Son iki onillikdə kütləvi rəqəmsallaşma elmi tədqiqatların mənzərəsini kəskin şəkildə dəyişdi. Xüsusi açar sözlər üçün mənbələrin rəqəmsal transkripsiyalarını axtarmaq imkanı dəyərli vaxta qənaət edir və alimlər mətni araşdırmaq istəsələr, artıq arxiv və kitabxanalarla məhdudlaşmırlar.

Bununla belə, rəqəmsal transkripsiyaların yayılması ilə bu cür əlçatanlığı təmin etmək üçün tələb olunan əməklə bağlı yeni narahatlıqlar yaranır. The Sixteenth Century Journal -da yeni məqalə tədqiqatçılara rəqəmsallaşdırılmış erkən müasir mənbələrin transkripsiyalarını əldə etmək üsullarını təklif edir, eyni zamanda qeyri-etik əmək təcrübələrindən qaçınır.

Müəlliflər Serena Strecker və Kimberly Liftonun “Erkən Müasir Çapın Rəqəmsal Arxivinin Kilidinin Açılması: Erkən Müasir Çap Kitablarının Avtomatik Transkripsiyası” transkripsiyaların hazırlanması üçün istifadə olunan iki növ proqram təminatının qısa tarixi ilə başlayır. Optical Character Recognition (OCR) proqramı özünü 19-cu əsrin sonu və 20-ci əsr əsərlərinin transkripsiyasına uyğun olduğunu sübut etdi, lakin erkən müasir çapda ümumi olan pozuntular OCR-ni bu mənbələrin etibarlı transkripsiyası üçün qeyri-adekvat edir.

Bunun əvəzinə, erkən müasir alimlər Əl Yazısı Mətnin Tanınması (HTR) texnologiyasına müraciət etdilər. Aparıcı HTR proqramı olan Transkribus istifadəçilərə ya ictimaiyyətə açıq olan transkripsiya proqram modelləri ilə məsləhətləşməyə və ya öz modellərini öyrətməyə imkan verir. 16-cı əsrin dörd nümunə kolleksiyasından seçilmiş səhifələr üzərində sınaqdan keçirilmiş müxtəlif HTR modellərini müqayisə edərkən Strecker və Lifton Transkribusun alimin arzuladığı mənbənin spesifikasiyasına uyğunlaşdırılmış məqsədli transkripsiya modellərinin yaradılmasını asanlaşdırmaq qabiliyyətini beş əsas addımda vurğulayırlar.

Transkribus-un ictimai modellərindən istifadə edərək, tədqiqatçılar öz yüksək dəqiqlikli modellərini hazırlamaq üçün lazım olan təlim məlumatlarını yarada bilərlər. Müəlliflərin fikrincə, bu proses Qlobal Cənubda aspirantların və ya işçilərin əməyi kimi xaricdən alınan əməyə etibar etməyi “artıq lazımsız və arzuolunmaz” edir.

“Erkən müasir çapın dəqiq və avtomatlaşdırılmış transkripsiyası ilə artıq məqsəd deyil, reallıqdır, erkən müasir tədqiqatlar sahəsi insan əməyi və maşın öyrənmə texnologiyasının hansı birləşməsinin qəbul ediləcəyini, dəstəklənəcəyini və nəticədə tədqiqatın gələcəyini formalaşdıracağını düşünməlidir” deyə müəlliflər yekunlaşdırırlar.

“Yalnız etik əmək təcrübələrində israr etməklə alimlər akademik iyerarxiya daxilində bərabərsizlikləri gücləndirməkdən və ya müstəmləkəçiliyin davamlı bərabərsizliklərini davam etdirməkdən qaça bilərlər.”

Daha çox məlumat: Serena Strecker və digərləri, Erkən Müasir Çapın Rəqəmləşdirilmiş Arxivinin Açılması: Erkən Müasir Çap Kitablarının Avtomatik Transkripsiyası, On Altıncı Əsr Jurnalı (2025). DOI: 10.1086/735052

Çikaqo Universiteti tərəfindən təmin edilmişdir 

Download QRPrint QR