Spis treści:
Dzień dobry, Czytelnicy Botland Blog! Czy ktoś z Was śpiewa, tańczy lub tańczy i śpiewa? Macie ulubionego piosenkarza, w którego chcielibyście się wcielić, podobnie jak w pewnym popularnym programie telewizyjnym? Nie ma sprawy! Oto deepfake – owoc technologii AI znacznie bardziej przekonujący niż nawet najlepsze dotychczas tworzone fotomontaże. Tylko… czy zawsze można bawić się czyjąś tożsamością?
Co to jest deepfake? Korzenie pomysłu – CGI
Deepfakes wykorzystują sztuczną inteligencję opartą na głębokim uczeniu, aby zastąpić podobiznę jednej osoby inną w materiałach wideo i innych mediach cyfrowych. Komputery stają się coraz lepsze w symulowaniu rzeczywistości. Koncepcja jest znana od dawna, a „podstawianie twarzy” jest przedmiotem wielu fanowskich fotomontaży i fotoszopek, właśnie najczęściej w postaci zdjęć.
Nowoczesne kino polega w dużej mierze na komputerowo generowanych efektach w miejscu prawdziwych postaci, scenerii czy rekwizytów. Dla niewprawnego oka dobrze wykonane sceny są często nie do odróżnienia od rzeczywistości. Rzecz w tym, że CGI, czyli obrazy generowane komputerowo, są niewiarygodnie trudne do przekonującego wykonania. Największe trudności sprawiają nie tyle sceny akcji, co efekty postarzania i odwzorowanie mimiki twarzy.
Nie żyjemy już w erze kina, w której uczestnicy strzelanin latali na sznurkach jak czarodzieje, ale wciąż co rusz natrafiamy na potworki pokroju glutowatego Reptile’a w Mortal Kombat: Annihilation (1997), nuklearnej eksplozji z udziałem lodówki w filmie Indiana Jones i Królestwo Kryształowej Czaszki (2008) albo rażąco sztucznego tygrysa w serialu The Walking Dead (2010-2021).
Co robi deepfake? Korzenie terminu – deep learning
Termin „deepfake” pochodzi od leżącej u jego podstaw technologii deep learning, czyli głębokiego uczenia, która narodziła się w pracy nad sztuczną inteligencją. Algorytmy głębokiego uczenia, które uczą się rozwiązywać problemy na podstawie dużych zbiorów danych, mogą być z powodzeniem wykorzystywane do przekonującej zamiany twarzy w materiałach wideo. A skoro w ludzkiej twarzy znajduje się około 70 unerwionych mięśni, to jest to zdecydowanie zadanie niełatwe.
Technologia deepfake wydaje się stosunkowo nowa, ale jej pochodzenie jest znacznie starsze. Była opracowywana przez naukowców w instytucjach akademickich już w latach 90. XX wieku, by później niejako przejść w ręce amatorów i entuzjastów w społecznościach internetowych. Korporacje, organizacje for profit, twórcy indywidualni i wreszcie branża rozrywkowa zaczęły korzystać z technologii mniej więcej w 2017 roku. Według niektórych wynalazek deepfake’ów rozpoczął się od programu Video Rewrite z 1997 roku. Oprogramowanie było w stanie zmodyfikować istniejące filmy przedstawiające osobę mówiącą. Poprzez umieszczenie nakładki audio na oryginalnym wideo osoba zdawała się wypowiadać słowa nowej ścieżki z poprawną synchronizacją ust. Ta technika opierała się na uczeniu maszynowym. Po początkowym zainteresowaniu deepfake’owymi treściami medialnymi ich zastosowanie w świecie rzeczywistym było raczej niewielkie.
Nowoczesny deepfake. Korzenie popularności – Reddit i społeczności internetowe
W ostatnich latach świat deepfake’ów zaczął nabierać rozpędu jak klasyczny internetowy viral. W 2017 roku słowo „deepfake” zostało po raz pierwszy użyte przez użytkownika portalu Reddit o tej samej nazwie. Użytkownik dzielił się na platformie różnymi treściami, najczęściej były to filmy deepfake z udziałem dorosłych celebrytów, w których wykorzystywano technologię open source faceswap.
Skąd ta rosnąca popularność? Pierwsza przyczyna drzemie w efekciarskim przedstawianiu tego, do czego zdolna jest AI, a druga… w ludzkich instynktach. Deepfakes powstały jako produkt uboczny algorytmów głębokiego uczenia i rozwoju sztucznej inteligencji.
Technologia deepfake została przeniesiona przede wszystkim do przemysłu rozrywkowego, a w szczególności do treści dla dorosłych i parodii filmowych. Deepfakes są świetnym przykładem tego, do czego obecnie zdolna jest AI, a także tego, jak kształtują się otaczające nas światy realny i cyfrowy. W czasach, w których społeczeństwo jest nierozerwalnie połączone z mediami społecznościowymi, deepfakes pozwalają na wypełnienie kreatywnych nisz. W końcu deepfake pozwala twórcy sprawić, że każdy może powiedzieć cokolwiek w dowolnym momencie. Jest to więc z natury narzędzie, które daje użytkownikowi dużą władzę. A z władzą jak to z władzą – może być wykorzystana do dobrych i złych celów.
Jak stworzyć deepfake?
Popularne powiedzenie mówi, że jeśli coś istnieje, to jest do tego apka. Oczywiście na kanwie popularności deepfakes powstało mnóstwo darmowych i płatnych aplikacji, które pozwalają na szybkie wygenerowanie przeróbki. Efekty są raczej przeciętne i głównie krążą jako treści przesyłane dla żartu wśród znajomych. Kilka takich aplikacji i programów to chińska aplikacja Zao, DeepFace Lab, FaceApp (do edycji zdjęć z wbudowanymi technikami AI) czy Face Swap. Wiele aplikacji zostało już usuniętych, ponieważ uznano je za niebezpieczne, ale czy jakiekolwiek aplikacje korzystające z przekonującej symulacji czyjejś twarzy mogą być w ogóle uznawane za bezpieczne? W sieci coraz częściej można natrafić na doniesienia, że przestępcy wykorzystują skradzione zdjęcia i dane uwierzytelniające znalezione w deepweb również do tworzenia deepfake’ów. O niebezpieczeństwach płynących z takich praktyk pisaliśmy tutaj.
Najczęściej wykorzystywana metoda polega na wykorzystaniu głębokich sieci neuronowych obejmujących autoenkodery stosujące technikę zamiany twarzy. Potrzebne jest docelowe wideo, które posłuży jako podstawa deepfake’u, a także kolekcja klipów wideo osoby, którą zamierzamy umieścić w materiale. Co ciekawe, filmy te mogą być zupełnie ze sobą niepowiązane – celem może być na przykład fragment hollywoodzkiego hitu, a filmy osoby, którą chcemy do niego wstawić, mogą być przypadkowymi klipami pobranymi z YouTube. Autoenkoder jako program AI z głębokim uczeniem przestudiuje klipy, aby zrozumieć, jak wygląda dana osoba z różnych perspektyw i przy różnych warunkach otoczenia, a następnie odwzoruje ją z docelowego filmu poprzez znalezienie wspólnych cech. Inny rodzaj uczenia maszynowego, znany jako Generative Adversarial Networks (GAN), to generatywne sieci współzawodniczące. GAN wykrywają i poprawiają wszelkie wady deepfake’a w ciągu wielu prób, a to z kolei utrudnia detektorom deepfake ich rozszyfrowanie.
Konsekwencje deepfake’ów
Wielu ekspertów uważa, że w przyszłości, w miarę dalszego rozwoju technologii, deepfakes staną się znacznie bardziej wyrafinowane i staną się źródłem wielu zagrożeń społecznych. Wymienia się tu ingerencję w wybory, napięcia polityczne i działalność przestępczą. Jednak czy narzędzia mogą być złe, czy raczej tylko ci, którzy ich używają w określony sposób? Wynaleziony ponad 12 000 lat temu nóż służy jednocześnie do zabijania, do krojenia jedzenia i do operacji chirurgicznych. Nie ma moralności w nożu kuchennym – nie jest on z natury dobry lub zły. Pomysłodawcy deepfakes z pewnością chcieli, aby technologia ta była używana głównie do tworzenia rozrywki i sztuki. Niestety, wykorzystywana jest też ona do praktyk tzw. identity theft – kradzieży i fałszerstwa tożsamości. Tak jak każdy rodzaj noża może nas zawieść i przez przypadek rozciąć skórę, tak i deepfakes mają niepokojący potencjał czynienia poważnej krzywdy. Wybór pomiędzy wariantem optymistycznym a pesymistycznym w prognozach rozwoju technologii deepfake pozostawiamy Wam.
Jak oceniasz ten wpis blogowy?
Kliknij gwiazdkę, aby go ocenić!
Średnia ocena: 4.9 / 5. Liczba głosów: 10
Jak dotąd brak głosów! Bądź pierwszą osobą, która oceni ten wpis.