#Araşdırmalar və Tədqiqatlar #Xəbərlər

Bu kompüter səsləri insan səsləri ilə yanılda bilər, amma bir nitq təbəqəsi yenə də illüziyanı pozur.

İna Vittmann, Maks Plank Cəmiyyəti tərəfindən

Lisa Lock tərəfindən redaktə edilib , Andrew Zinin tərəfindən nəzərdən keçirilib

 Redaktorların qeydləri

 GIST

Tercih edilən mənbə kimi əlavə edin


İnsanlar real və kompüter tərəfindən yaradılan səslər arasındakı fərqi necə qəbul edirlər? Müəllif: MPIEA / L. Bittner

Bu günlərdə naviqasiya sistemlərindən və səs köməkçilərindən tutmuş avtomatlaşdırılmış elanlara qədər kompüter tərəfindən yaradılan səslərlə əhatə olunmuşuq. Bəs bu səslər əslində necə insan səslənir? Almaniyanın Frankfurt-Mayn şəhərində yerləşən Maks Plank Empirik Estetika İnstitutunun (MPIEA) ” Speech Communication” jurnalında dərc olunmuş son tədqiqatı göstərir ki, qavrayışımıza üç şey təsir edir: bir şeyin necə deyilməsi, nəyin deyilməsi və dili başa düşüb-düşməməyimiz.

https://d154c4efc98a67d7aff95ec60025202e.safeframe.googlesyndication.com/safeframe/1-0-45/html/container.html

Ardıcıl iki təcrübədə tədqiqatçılar insanların həqiqi və sintetik səslər arasındakı fərqi necə qavradıqlarını araşdırdılar. Onlar 16 qısa alman cümləsi yaratdılar, məsələn: “Oğlan atasına papaq verdi”. Daha sonra komanda söz sırasını dəyişdirərək, sözləri oxşar səslənən yalançı sözlərlə əvəz edərək və hər iki dəyişikliyi birləşdirərək cümlələri üç fərqli şəkildə manipulyasiya etdi. Nəticədə hər cümlənin dörd versiyası yarandı. Bütün versiyalar səkkiz insan natiqi və səkkiz kompüter tərəfindən yaradılan mətndən nitqə (TTS) səsləri tərəfindən qeydə alınıb.

İlk təcrübədə 40 almandilli iştirakçı səslərin insan səslərini necə səsləndirdiyini qiymətləndirdi. Ümumilikdə, kompüter tərəfindən yaradılan səslər insan səslərindən daha az insan səsləri kimi qəbul edildi. Səslərin akustik xüsusiyyətlərinin təhlili insan və TTS tərəfindən yaradılan səslər arasında səsdə obyektiv olaraq ölçülə bilən fərqlər aşkar etdi.

MPIEA-nın aparıcı müəllifi Janniek Wester bildirib ki, “Biz aşkar etdik ki, səsin tembri və ya rəngi, eləcə də intonasiyası iki səs növü arasında fərqlidir. Bu fərqlər dinləyicilər üçün səslərin insan səslərinə necə təsir etdiyini müəyyən edə bilər”.

Səsin akustikasından başqa, deyilənlərin məzmunu da insan səsinin dinləyiciyə necə səsləndiyinə təsir göstərir. Tədqiqatçılar müəyyən ediblər ki, iştirakçılar manipulyasiya edilmiş cümlələri, həqiqi bir şəxs və ya TTS tərəfindən yaradılan səs tərəfindən danışılmasından asılı olmayaraq, orijinal cümlələrdən daha az insani kimi qəbul edirlər. Lakin, tədqiqatın ikinci hissəsində aşkar edildiyi kimi, bu təsir yalnız dinləyicilər dili başa düşdükdə özünü göstərir.

https://d154c4efc98a67d7aff95ec60025202e.safeframe.googlesyndication.com/safeframe/1-0-45/html/container.html

Bu təcrübədə 40 almandilli, 40 ispandilli və 40 türkdilli iştirakçı səsləri qiymətləndirdi. Nəticələr göstərdi ki, alman dilini bilməyən insanlar üçün dil məzmunu səslərin qiymətləndirilməsində heç bir rol oynamayıb. Onlar sintetik səsləri anadilli səslərlə müqayisədə daha çox insana bənzətsələr də, ümumiyyətlə insan və süni səsləri ayırd edə bilirdilər.

Bundan əlavə, dinləyicilərin yaşı onların qiymətləndirməsində rol oynayır, MPIEA-nın baş müəllifi Pauline Larrouy-Maestri belə bir nəticəyə gəlir: “Tədqiqatlarımızda yaşlı yetkinlərin kompüter tərəfindən yaradılan səsləri gənclərə nisbətən daha çox insan səsləri kimi qəbul etdiklərini və bunun səbəbini anlamaq istədiyimizi müşahidə edirik.” Müxtəlif yaş qruplarından olan iştirakçıları əhatə edən gələcək bir araşdırmada tədqiqatçılar bunu daha ətraflı araşdırmağı planlaşdırırlar.

Daha çox məlumat

Janniek Wester və digərləri, İnsanlığın qavranılması nitq məzmunundan təsirlənir, Nitq Ünsiyyəti (2026). DOI: 10.1016/j.specom.2026.103398

Maks Plank Cəmiyyəti tərəfindən təmin edilir 

Leave a comment

Sizin e-poçt ünvanınız dərc edilməyəcəkdir. Gərəkli sahələr * ilə işarələnmişdir