Pe măsură ce inteligența artificială devine tot mai integrată în viețile noastre, majoritatea oamenilor nu mai pot face diferența între vocile umane și clonele lor sintetice, arată un nou studiu despre care relatează jurnaliștii de la Euronews.
Inteligența artificială (AI) a devenit o parte obișnuită a vieții de zi cu zi pentru mulți dintre noi. O vedem în textele generate care ne apar pe rețelele sociale, vorbim cu ea prin intermediul modelelor lingvistice avansate și o auzim de fiecare dată când Alexa de la Amazon reacționează la o comandă. Totuși, pe măsură ce tehnologia avansează rapid, devine din ce în ce mai greu să deosebim ceea ce este real de ceea ce nu este.
Într-un nou studiu publicat în revista PLoS One, cercetătorii au descoperit că majoritatea oamenilor nu mai pot distinge între vocile generate de inteligența artificială și vocile umane din care acestea au fost clonate.
Participanților li s-au oferit mostre din 80 de voci diferite — jumătate generate de AI, cealaltă jumătate umane. Ei au fost apoi rugați să evalueze ceea ce au auzit, pe o scară care măsura nivelurile de încredere sau dominare ale vocilor.
În categoria vocilor generate de AI au fost incluse două tipuri: voci generice, create de la zero, și voci clonate, realizate pe baza înregistrărilor unor persoane reale.
Deși majoritatea participanților au recunoscut vocile generice ca fiind false, versiunile sintetice clonate s-au dovedit mult mai greu de identificat: 58% dintre acestea au fost confundate cu voci reale. Prin comparație, 62% dintre vocile umane autentice au fost corect identificate ca fiind reale — o diferență foarte mică între capacitatea respondenților de a le deosebi.
„Cel mai important aspect al cercetării este faptul că vocile generate de AI — în special clonele vocale — sună la fel de uman ca înregistrările reale ale vocilor umane”, a declarat pentru Euronews Next dr. Nadine Lavan, autoarea principală a studiului și lector universitar în psihologie la Queen Mary University of London.
„Este remarcabil, mai ales dacă ne gândim că am folosit instrumente comerciale disponibile publicului, cu care oricine poate crea voci realiste fără a cheltui sume mari de bani și fără a avea cunoștințe de programare sau abilități tehnice speciale.”
Îngrijorări legate de clonarea vocală
Tehnologia de clonare vocală bazată pe inteligență artificială funcționează prin analizarea și extragerea caracteristicilor esențiale din datele vocale. Datorită capacității sale de a imita cu o precizie uimitoare, aceasta a devenit un instrument preferat de escrocii telefonici, care folosesc uneori postări de pe rețelele sociale pentru a reproduce vocea persoanelor dragi ale victimelor.
Vârstnicii sunt cei mai expuși riscului — cel puțin două treimi dintre persoanele de peste 75 de ani au fost ținta unor tentative de fraudă telefonică, potrivit cercetărilor realizate de Universitatea din Portsmouth. De asemenea, studiul a arătat că aproape 60% dintre tentativele de escrocherie sunt realizate prin apeluri vocale.
Deși nu toate aceste apeluri folosesc voci generate de AI, fenomenul devine tot mai răspândit datorită sofisticării și accesibilității software-ului, exemple populare fiind Hume AI și ElevenLabs.
Clonarea vocală prin AI a devenit, de asemenea, un motiv de îngrijorare în industria divertismentului, unde vocile mai multor celebrități au fost folosite fără permisiune. Anul trecut, Scarlett Johansson a criticat public OpenAI pentru utilizarea unei voci „în mod tulburător asemănătoare” cu a ei, inspirată din filmul Her, în cadrul serviciului ChatGPT.
De asemenea, se răspândește utilizarea pe scară largă a deepfake-urilor audio, care au imitat anterior politicieni sau jurnaliști în încercarea de a influența opinia publică și de a răspândi dezinformarea.
Pe măsură ce aceste abuzuri continuă să se infiltreze în societate, dr. Nadine Lavan consideră că dezvoltatorii de inteligență artificială au responsabilitatea de a implementa măsuri de protecție mai stricte.
„Din perspectiva noastră, ca cercetători, am recomanda întotdeauna ca firmele care creează astfel de tehnologii să colaboreze cu eticieni și decidenți politici pentru a analiza problemele etice și legale legate, de exemplu, de dreptul de proprietate asupra vocii, consimțământul (și cât de departe poate merge acesta într-un peisaj aflat în continuă schimbare)”, a spus Lavan.
Îmbunătățirea accesibilității
Ca orice tehnologie, și vocile generate de inteligența artificială pot fi folosite în scopuri benefice — având un potențial deosebit pentru persoanele mute sau care au dificultăți de vorbire.
„Acest tip de tehnologie asistivă este folosit de ceva timp, iar Stephen Hawking este unul dintre cele mai emblematice exemple. Ceea ce este nou, însă, este capacitatea de a personaliza vocile sintetice în moduri care înainte nu erau posibile”, a explicat dr. Nadine Lavan.
„Astăzi, utilizatorii pot alege să-și recreeze vocea originală, dacă preferă acest lucru, sau pot proiecta o voce complet nouă, care să le reflecte identitatea și gusturile personale.”
Ea a mai menționat că, folosită etic și responsabil, această tehnologie ar putea îmbunătăți accesibilitatea și diversitatea în domenii precum educația, radiodifuziunea sau producția de cărți audio.
De exemplu, un studiu recent a constatat că învățarea asistată de AI prin materiale audio a crescut motivația și implicarea în lectură a elevilor, în special a celor cu neurodiversitate, cum ar fi tulburarea de deficit de atenție și hiperactivitate (ADHD).
„O altă dezvoltare fascinantă este capacitatea de a clona o voce în diferite limbi, permițând oamenilor să se reprezinte pe ei înșiși dincolo de granițele lingvistice, păstrându-și în același timp identitatea vocală. Acest lucru ar putea fi transformator pentru comunicarea globală, accesibilitate și schimbul cultural”, a adăugat dr. Nadine Lavan.
Pe măsură ce vocile artificiale devin tot mai prezente în viețile noastre, nuanțele modului în care le folosim și interacționăm cu ele vor continua să evolueze. Lavan își propune să aprofundeze acest subiect prin cercetări viitoare, concentrându-se pe percepția vocilor generate de AI.
„Mi-ar plăcea să explorez mai în detaliu modul în care faptul că o persoană știe sau nu că o voce este generată de AI îi influențează felul în care interacționează cu acea voce”, a spus ea.
„De asemenea, ar fi foarte interesant de văzut cum percep oamenii vocile AI care sună plăcut și agreabil, dar în mod clar neuman: de exemplu, oamenii ar fi mai dispuși sau mai reticenți să urmeze instrucțiunile acestor voci plăcute, dar artificiale? Ar fi mai predispuși sau mai puțin predispuși să se enerveze pe ele atunci când ceva nu funcționează?”
„Toate aceste întrebări sunt extrem de interesante dintr-o perspectivă de cercetare și ne pot spune multe despre ce contează în interacțiunile umane — sau în cele dintre oameni și computere”, a concluzionat Lavan.
Articolul original poate fi citit AICI.