Cel puțin 15 milioane de videoclipuri au fost acaparate de companiile de tehnologie, arată o investigație a jurnaliștilor de la The Atlantic.
Când Jon Peters a încărcat primul său videoclip pe YouTube, în 2010, nu avea nicio idee unde îl va duce asta. Era un tâmplar profesionist care conducea o mică afacere și a decis să se filmeze în timp ce făcea o masă de sufragerie. S-a dovedit că oamenilor le-a plăcut stilul său direct, iar pe măsură ce a postat mai multe videoclipuri, a început să se formeze o bază de fani. „Dintr-odată apar oameni care apreciază munca pe care o fac”, a spus el.
Cincisprezece ani mai târziu, canalul său are peste 1 milion de abonați. Uneori primește fotografii de la oameni din atelierele lor, urmându-i indicațiile de pe un televizor mare de pe perete—cei mai mulți dintre privitorii lui, spune Peters, sunt tâmplari care îl privesc pentru îndrumare.
Dar canalul lui Peters ar putea deveni în curând învechit, alături de milioane de alte videoclipuri create de oameni care își împărtășesc expertiza și sfaturile pe YouTube. În ultimele luni, am descoperit peste 15,8 milioane de videoclipuri provenind de la mai mult de 2 milioane de canale, pe care companiile de tehnologie le-au descărcat, fără permisiune, pentru a antrena produse AI.
Aproape 1 milion dintre ele, sunt videoclipuri de tip „cum să faci”. În cele mai multe cazuri, videoclipurile sunt anonimizate, ceea ce înseamnă că titlurile și numele creatorilor nu sunt incluse.
Pentru a crea produse AI capabile să genereze videoclipuri, dezvoltatorii au nevoie de cantități uriașe de materiale video, iar YouTube a devenit o sursă frecventă. Deși YouTube le oferă abonaților plătitori posibilitatea de a descărca videoclipuri și de a le viziona prin aplicația companiei ori de câte ori doresc, aceasta este o situație diferită: fișierele video sunt extrase în masă de pe YouTube și salvate în fișiere care sunt apoi introduse în algoritmi AI.
Acest tip de descărcare încalcă termenii și condițiile platformei, dar multe instrumente le permit dezvoltatorilor de AI să descarce videoclipurile în acest mod. YouTube pare să fi făcut puține lucruri, dacă nu chiar nimic, pentru a opri descărcarea în masă, iar compania nu a comentat situația.
Nu toate videoclipurile de pe YouTube sunt protejate prin drepturi de autor (iar unele sunt încărcate de persoane care nu dețin drepturile), dar multe sunt. Copierea sau distribuirea neautorizată a acestor videoclipuri este ilegală, însă dacă antrenarea AI constituie o formă de copiere sau distribuire este încă o chestiune dezbătută în numeroase procese aflate pe rol.
Companiile de tehnologie au susținut că antrenarea reprezintă un „fair use” al operelor protejate, iar unii judecători au respins acest argument în răspunsurile lor. Modul în care instanțele vor aplica, în cele din urmă, legea acestei tehnologii noi ar putea avea consecințe uriașe asupra motivației creatorilor de a-și posta munca pe YouTube și pe platforme similare—dacă firmele de tehnologie pot continua să folosească munca creatorilor pentru a construi produse AI care concurează cu ei, atunci creatorii s-ar putea vedea nevoiți să înceteze să mai publice.
Instrumentele de tip AI generativ produc deja videoclipuri care concurează cu munca realizată de oameni pe YouTube. Videoclipurile cu conținut istoric generate de AI, care adună sute de mii de vizualizări și conțin numeroase inexactități, ajung să sufoce materialele verificate și realizate de experți. Videoclipurile populare cu remixuri muzicale sunt adesea create folosind această tehnologie, iar multe dintre ele au performanțe mai bune decât cele realizate de oameni.
Problema depășește însă cu mult YouTube. Majoritatea chatboților moderni sunt „multimodali”, ceea ce înseamnă că pot răspunde la o întrebare creând materiale media relevante. De exemplu, chatbotul Gemini de la Google va produce clipuri scurte pentru utilizatorii plătitori. În curând, vei putea cere lui ChatGPT sau unui alt instrument AI generativ să îți arate cum să construiești o masă din picioare găsite și să primești un videoclip personalizat de tip „cum să faci”.
Chiar dacă acel răspuns nu va fi la fel de bun ca un videoclip realizat de Peters, va fi instantaneu și adaptat exact cerințelor tale.
Multe companii mari de tehnologie au folosit aceste seturi de date pentru a antrena AI. Grupul include Microsoft, Meta, Amazon, Nvidia, Runway, ByteDance, Snap și Tencent. Am contactat fiecare dintre aceste companii pentru a întreba despre utilizarea acestor seturi de date. Doar Meta, Amazon și Nvidia au răspuns. Toate trei au spus că „respectă” creatorii de conținut și cred că utilizarea operelor lor este legală conform legislației actuale privind drepturile de autor. Amazon a mai precizat că, în ceea ce privește videoclipurile, se concentrează în prezent pe dezvoltarea unor modalități de a genera „reclame atractive, de înaltă calitate, pornind de la comenzi simple”.
Nu putem fi siguri dacă toate aceste companii vor folosi videoclipurile pentru a crea instrumente generatoare de conținut video cu scop comercial. O parte din munca lor ar putea fi pur experimentală. Însă câteva dintre aceste companii au, în mod evident, interesul de a dezvolta produse comerciale: Meta, de pildă, creează o suită de instrumente numită Movie Gen care generează videoclipuri pe baza unor comenzi text, iar Snap oferă „AI Video Lenses” care le permit utilizatorilor să își modifice videoclipurile cu ajutorul AI generativ. Videoclipurile din aceste seturi de date reprezintă materia primă pentru astfel de produse; la fel cum ChatGPT nu ar fi putut scrie ca Shakespeare fără să „citească” mai întâi Shakespeare, un generator video nu ar putea construi un jurnal fals fără să „vizioneze” o mulțime de emisiuni înregistrate.
Cei care creează seturi de date încearcă adesea să evite videoclipurile care conțin text suprapus, precum subtitrări și logo-uri, pentru ca aceste elemente de identificare să nu apară în videoclipurile generate de model. Așadar, un sfat pentru YouTuberi: plasarea unui watermark sau a unui logo pe videoclipuri, chiar și unul mic, le face mai puțin atractive pentru antrenare.
Pentru a pregăti videoclipurile pentru antrenament, dezvoltatorii fragmentează materialul în clipuri scurte, de multe ori tăind acolo unde apare o schimbare de scenă sau de cameră. Fiecărui clip i se atribuie apoi o descriere în limba engleză a scenei vizuale, astfel încât modelul să poată fi instruit să coreleze cuvintele cu imaginile în mișcare și să genereze videoclipuri pe baza comenzilor text. Dezvoltatorii AI folosesc câteva metode pentru a redacta aceste descrieri. O modalitate este să plătească oameni pentru a le scrie. Alta este să utilizeze modele AI separate care să genereze automat descrierea. Aceasta din urmă este mai frecventă, datorită costului mai redus.
Instrumentele video AI nu sunt încă la fel de răspândite ca chatboții sau generatorii de imagini, dar sunt deja utilizate pe scară largă. Probabil că ai văzut deja videoclipuri manipulate cu AI fără să îți dai seama. De exemplu, TED folosește AI pentru a dubla prezentările vorbitorilor în diferite limbi. Asta include atât video, cât și audio: gurile vorbitorilor sunt sincronizate cu noile cuvinte, astfel încât pare că vorbesc japoneză, franceză sau rusă. Nishat Ruiter, consilierul juridic general al TED, a spus că acest lucru se face cu știrea și consimțământul vorbitorilor.
Există și produse destinate consumatorilor pentru a modifica videoclipuri cu ajutorul AI. Dacă fața ta nu arată bine, de exemplu, poți încerca un face-enhancer precum Facetune sau poți renunța complet la chipul tău folosind un face-swapper precum Facewow. Cu Aleph de la Runway, poți schimba culorile obiectelor sau transforma o zi însorită într-o furtună de zăpadă.
Există apoi instrumente care generează videoclipuri noi pe baza unei imagini furnizate de tine. Google îi încurajează pe utilizatorii Gemini să își anime „fotografiile preferate”. Rezultatul este un clip care extrapolează opt secunde de mișcare dintr-o imagine inițială, făcând o persoană să danseze, să gătească sau să lovească o minge de golf.
Acestea sunt adesea uimitoare și înfricoșătoare în același timp. „Generarea de capete vorbitoare”—de exemplu, pentru videoclipurile de orientare a angajaților—înaintează rapid. Vidnoz AI promite să creeze „Purtători de cuvânt AI realiști, de orice stil.”
O companie numită Arcads va genera o reclamă completă, cu actori și voice-over. ByteDance, compania care deține TikTok, oferă un produs similar numit Symphony Creative Studio. Alte aplicații ale generării video prin AI includ probarea virtuală a hainelor, crearea de jocuri video personalizate și animarea personajelor de desene animate și a oamenilor.
Unele companii lucrează în același timp cu AI și încearcă să își apere conținutul de la a fi furat de alte companii de AI. Aceasta reflectă mentalitatea de „Vest Sălbatic” care domină acum în domeniul AI.
În iunie, festivalul internațional de publicitate Cannes Lions a acordat unul dintre premiile Grand Prix unei reclame care conținea imagini falsificate (deepfake) dintr-o prezentare TED a DeAndreei Salvador, în prezent senator de stat în Carolina de Nord. Agenția de publicitate DM9 „a folosit clonarea prin AI pentru a-i modifica discursul și l-a reutilizat într-o campanie publicitară”.
Când manipularea a fost descoperită, festivalul Cannes Lions a retras premiul. Luna trecută, Salvador a dat în judecată DM9, împreună cu clienții săi—Whirlpool și Consul. DM9 și-a cerut scuze pentru incident și a invocat „o serie de erori în producerea și transmiterea” reclamei. Un purtător de cuvânt al Whirlpool a spus că firma nu știa că declarațiile senatoarei fuseseră modificate.
Alți reprezentanți ai industriei cinematografice au intentat procese împotriva companiilor de AI pentru antrenarea cu conținutul lor. În iunie, Disney și Universal au dat în judecată Midjourney, creatorul unui instrument de generare de imagini capabil să producă personaje recognoscibile (Warner Brothers s-a alăturat procesului săptămâna trecută). Procesul a numit Midjourney un „hău fără fund al plagiatului”.
Luna următoare, două companii de filme pentru adulți au dat în judecată Meta pentru descărcarea (și distribuirea prin BitTorrent) a peste 2.000 de videoclipuri ale lor. Nici Midjourney, nici Meta nu au răspuns acuzațiilor și nici nu au răspuns solicitării de comentarii.
Personajele Disney și reclama falsificată cu Salvador sunt doar două exemple ale modului în care aceste instrumente pot fi dăunătoare. Datorită investițiilor uriașe în această tehnologie, videoclipurile generate de AI încep să apară peste tot.
O companie, DeepBrain AI, plătește „creatori” pentru a posta pe YouTube videoclipuri generate cu instrumentele sale. În prezent oferă 500 de dolari pentru un videoclip care atinge 10.000 de vizualizări, un prag relativ scăzut. Companiile care dețin platforme de socializare, precum Google și Meta, plătesc și ele utilizatorii pentru conținut, prin împărțirea veniturilor din reclame, și multe dintre ele încurajează direct postarea de conținut generat de AI. Nu este de mirare că a apărut deja o cohortă de „guru” care predau secretele câștigării de bani din conținut AI.
Google și Meta și-au antrenat, de asemenea, instrumentele AI pe cantități masive de videoclipuri de pe propriile platforme: Google a folosit cel puțin 70 de milioane de clipuri de pe YouTube, iar Meta a folosit peste 65 de milioane de clipuri de pe Instagram.
Dacă aceste companii reușesc să își inunde platformele cu videoclipuri sintetice, creatorii umani ar putea rămâne cu ingrata sarcină de a concura cu mașini care produc la nesfârșit conținut bazat pe munca lor originală. Iar rețelele sociale vor deveni și mai puțin sociale decât sunt acum.
L-am întrebat pe Peters dacă știa că videoclipurile sale au fost preluate de pe YouTube pentru a antrena AI. A spus că nu știa, dar nu era surprins. „Cred că totul o să fie furat”, a spus el. Dar nu știa ce să facă în legătură cu asta. „Renunț sau continui să fac videoclipuri și sper că oamenii vor să se conecteze cu o persoană?”
Articolul original poate fi citit AICI.