captcha image

A password will be e-mailed to you.

Armia amerykańska finansująca badania nad wykrywaniem złowieszczych algorytmów, automatyczne podmienianie twarzy i ataki na sieci neuronowe. Brzmi jak niezły kryminał science-fiction? Nie, to już codzienność uczenia maszynowego.

Uczenie maszynowe, bądź Machine Learning, brzmi niemal tak samo magicznie i tajemniczo jak Sztuczna Inteligencja. A cóż dopiero głębokie uczenie maszynowe (Deep Learning)! Rozkładając te terminy na czynniki pierwsze i zaglądając do najnowszych zastosowań zjawisk, które się za nimi kryją, dojdziemy do wniosku, że trochę mniej tu magii, natomiast jak najbardziej sporo najlepszej technologii.

Jak uczyć maszynę?

Uczenie maszynowe jest szeroką kategorią algorytmów, które mają na celu wykonywanie określonych zadań w sposób automatyczny. Taki algorytm ma uczyć się na podstawie gromadzonych danych i przetwarzać je za pomocą wbudowanych metod statystycznych, oraz nabywać nową “wiedzę” i podejmować różnorakie decyzje (o nich poniżej!). Nie powinno więc dziwić, że algorytmy te są częścią większej kategorii “sztuczna inteligencja”, ponieważ naśladują one ludzkie mechanizmy poznawcze.

Algorytmy głębokiego uczenia maszynowego natomiast są jednymi z najbardziej zaawansowanych. Są one zbudowane w taki sposób, by naśladowały biologiczne sieci neuronowe. Każdy z takich “sztucznych neuronów” jest tak naprawdę informacją, która jest przesyłana dalej do następnych neuronów i ich warstw. Poszczególne warstwy “uczą” się przetwarzać kolejne cechy obiektów/obrazów/dźwięków itp., dzięki czemu są w stanie odtwarzać całe obiekty w bardzo rzeczywisty sposób (przykłady poniżej). Dane przechodzą przez kolejne warstwy przetwarzania w takich sieciach neuronów, dlatego właśnie nazywamy je “głębokimi”.

Przykładowy schemat sztucznej sieci neuronowej z wieloma warstwami. Źródło: http://www.cs.put.poznan.pl/jstefanowski/aed/TPDANN.pdf

Przykładowy schemat sztucznej sieci neuronowej z wieloma warstwami. Źródło: http://www.cs.put.poznan.pl/jstefanowski/aed/TPDANN.pdf

Tyle teorii, a teraz spróbujmy się czegoś (głęboko) nauczyć

Przechodząc od teorii do praktyki – gdzie używane jest głębokie uczenie? Lista zastosowań już teraz jest długa, a dosłownie co roku znacznie rozszerza się. Algorytmy potrafią rozpoznawać i wytwarzać realistyczną mowę, tłumaczyć tekst, kontrolować zachowania robotów i przetwarzać obraz. W tym tekście skupię się jednak na analizie i wytwarzaniu obrazów.

Przykłady dziedzin, w których używa się głębokiego uczenia. Źródło: https://arxiv.org/abs/1803.01164

Przykłady dziedzin, w których używa się głębokiego uczenia. Źródło: https://arxiv.org/abs/1803.01164

Perfekcyjny generator memów?

Głębokiego uczenia używa się nie tylko w celach tworzenia systemów ostrzegania samobieżnych aut czy wykrywania komórek rakowych, ale również w jakże istotnych dziedzinach memetyki! 😉 Istnieje nawet cały dział uczenia maszynowego nazywany Deep Fakes, czyli w wolnym tłumaczeniu “Głębokie oszustwa”. Poniżej prezentuję parę filmów przerobionych w taki sposób, że na twarze aktorek/aktorów nakładana jest twarz Nicolasa Cage’a. Cytując pułkownika Kurtza z “Czasu Apokalipsy” (na szczęście jeszcze na jego twarz nie nałożono Cage’a): “Horror, horror…”

Tu Nicolas Cage w “Człowieku ze stali” (w którym nie występował). Jego twarz nałożono na na twarz Amy Adams. Ostrzegam – tylko dla ludzi o mocnych nerwach! 😉

Nicolas Cage w "Indiana Jones"...

Nicolas Cage w “Indiana Jones”…

... oraz w "Star Wars"

… oraz w “Star Wars”

Ataki na sieci neuronowe

Niezwykle ciekawym zagadnieniem są tzw. ataki na sieci neuronowe, gdzie programiści dodają do obrazków niewidoczny dla ludzi szum, który jednak powoduje, że algorytmy się gubią, i na przykład obrazek autobusu oznaczają jako strusia. Na poniższym obrazku dla nas, ludzi (o ile jesteś człowiekiem, czytelniku) widać dwa autobusy. Tymczasem dla maszyny zdjęcie po lewej to autobus, a po prawej – właśnie struś. Prawdziwie sztuczna “inteligencja”…

Żeby nie było – my również podlegamy wielu złudzeniom i pomyłkom wizualnym, czego przykładów psychologia poznawcza może podać setki (zajrzyj choćby tu, tu czy tu). Co ciekawe, stworzono algorytm głębokiego uczenia, którego zadaniem jest oszukiwać nasz system percepcyjny. Takie przykłady pozwalają nam dowiedzieć się czegoś nie tylko na temat uczenia maszynowego, ale i ludzkiego układu wzrokowego! Poniżej przykład jego działania.

Po lewej mamy obrazek kota, natomiast po prawej? To kot, czy już pies? Źródło: https://arxiv.org/pdf/1802.08195.pdf

Po lewej mamy obrazek kota, natomiast po prawej? To kot, czy już pies? Źródło: https://arxiv.org/pdf/1802.08195.pdf

Przyszłość uczenia maszynowego

Wiemy już jakie są możliwości algorytmów, potrafią wyekstrahować cechy ludzi, zwierząt, obiektów i umieścić je w nowym kontekście, jak na przykład w przypadku generowania obrazków koto-podobnych z naszych swobodnych szkiców.

Ten algorytm nakłada “kocie tekstury” na nasze szkice. Zachęcam do pobawienia się nim: https://laughingsquid.com/edges2cats/

Ten algorytm nakłada “kocie tekstury” na nasze szkice. Zachęcam do pobawienia się nim: https://affinelayer.com/pixsrv/

Mówiąc już bardziej serio – oczywiście głębokie uczenie przyda się do znacznie ciekawszych zastosowań. Już teraz algorytmy potrafią tworzyć obrazy na podstawie naszych opisów (np. “stwórz obraz człowieka wspinającego się na drzewo”), realistycznie zmieniać porę dnia na zdjęciach z wakacji, czy tworzyć obraz satelitarny na podstawie bardzo prostej i schematycznej mapy. Myślę jednak, że prawdziwy rozkwit nastąpi w dziedzinie tworzenia realistycznych materiałów wideo za pomocą sieci neuronowych. Oprócz niedorzecznych przykładów podanych powyżej, już teraz można sprawić, że Obama czy Putin z klipu video CNN czy Russia Today zaczną ruszać się i mówić w taki sposób, jaki nakaże im programista.

Uśmiechający się Putin? Niemożliwe! Nie, to tylko deepfake w działaniu. Armia amerykańska jest tak zaniepokojona możliwościami tworzenia realistycznych fake newsów za pomocą tej technologii, że finansuje badania mające na celu wychwycić deepfake’i i inne oszustwa wytwarzane za pomocą algorytmów AI… Źródło: MIT Technology Review.

Uśmiechający się Putin? Niemożliwe! Nie, to tylko deepfake w działaniu. Armia amerykańska jest tak zaniepokojona możliwościami tworzenia realistycznych fake newsów za pomocą tej technologii, że finansuje badania mające na celu wychwycić deepfake’i i inne oszustwa wytwarzane za pomocą algorytmów AI… Źródło: MIT Technology Review.

Ten film to z kolei przykład wykonanej tą techniką manipulacji, gdzie aktor Jordan Peele manipuluje wizerunkiem Obamy:

Możliwości manipulowania obrazem są jednocześnie przerażające, jak i fascynujące. Być może niedługo będziemy w stanie tworzyć całe filmy “za pomocą” podobizn najznamienitszych aktorów, bez ich realnego udziału. Jeśli dorzucimy do tego rzeczywistość wirtualną, to powstaje przepis na niesamowity rozwój interaktywnej kinematografii i gier…

 

Artykuł jest komplementarną częścią audycji Homo Science emitowanej 2 czerwca 2018 roku

Nie ma więcej wpisów