Sztuczna inteligencja zabije fotografię? Nowy system zamieni bazgroły w zdjęcia krajobrazu

Artykuł/Foto 20.03.2019
Sztuczna inteligencja zabije fotografię? Nowy system zamieni bazgroły w zdjęcia krajobrazu

Sztuczna inteligencja zabije fotografię? Nowy system zamieni bazgroły w zdjęcia krajobrazu

Fotografowie krajobrazu go nienawidzą. GauGAN robi lepsze zdjęcia, a nie wychodzi nawet z domu – tak mogłyby brzmieć clickbaitowe nagłówki przyszłości. Czy fotografowie rzeczywiście powinni obawiać się sztucznej inteligencji?

Pamiętacie słynne „dzieło” 80-letniej Cecili Gimenez z hiszpańskiego miasteczka Borja? W 2012 roku postanowiła uratować ponad stuletni obraz namalowany na jednej ze ścian lokalnego kościoła. Miała dobre chęci, ale wyszło… no właśnie. Powiedzmy, że wyszło tak sobie.

Obraz przed i po "renowacji".
Obraz przed i po “renowacji”.

Nowa wersja „Ecce Homo”, bo tak nazywa się to oryginalne dzieło, przypomina bardziej bazgroły kilkulatka, niż wartościowy obraz. I trzeba też przyznać, że obraz ten nie odbiega zapewne zbyt mocno od potencjalnego efektu prac wielu z nas. Osób, które z malowaniem czy rysowaniem nie mają w praktyce za wiele wspólnego.

Teraz wyobraźmy sobie, że z takich bazgrołów system tworzy nam piękne zdjęcia.

Wystarczy postawić kilka kresek, dodać kolory, jakiś prosty obiekt z kółka i lini i mamy fotografię krajobrazu z górami, chmurami, łąką i drzewem. Brzmi jak bajka, prawda? A może koszmar? Tymczasem to już nawet nie jest melodia przyszłości, a rzeczywistość. Przynajmniej w pewnym stopniu. Firma NVIDIA zaprezentowała właśnie na swoim blogu wideo pokazujące możliwości nowego systemu wykorzystującego sztuczną rzeczywistość do tworzenia syntetycznych fotorealistycznych obrazów na bazie bazgrołów.

Początkujący malarz może ustawić pędzel na płótnie, aby stworzyć oszałamiający krajobraz zachodzącego słońca – skaliste, pokryte śniegiem szczyty odbijające się w szklistym jeziorze – aby skończyć z czymś, co wygląda bardziej jak wielobarwny kleks. Ale model głębokiego uczenia się opracowany przez firmę NVIDIA Research może zrobić coś wręcz przeciwnego: zamienia gryzmoły w fotorealistyczne arcydzieła z zapierającą dech w piersiach łatwością – czytamy na blogu NVIDIA.

GauGAN, bo tak nazywa się ten system, potrafi zamienić dziecinnie proste obrazy w fotografie krajobrazu. Albo coś, co ma je przypominać.

I rzeczywiście je przypomina. Póki co tylko przypomina zdjęcia z dwóch podstawowych względów. Po pierwsze i chyba najważniejsze, czy obrazy wygenerowane w niemal całości przez maszynę, mogą być nazywane zdjęciami? Raczej nie. Nie pokazują niczego, co istnieje, a jedynie pewne wizje twórcy. Po drugie, są to tylko syntetyczne produkty, którym do prawdziwych zdjęć jeszcze sporo brakuje. Szczególnie po przyjrzeniu się detalom. Ale z czasem ich jakość może zdecydowanie się polepszyć.

GauGAN, fot. Nvidia
GauGAN, fot. Nvidia
GauGAN, fot. Nvidia
GauGAN, fot. Nvidia

Sztuczna inteligencja stojąca za tymi „zdjęciami” była ćwiczona na podstawie miliona zdjęć.

Cel był jeden – nauczyć algorytm w jak najbardziej realistyczny sposób wypełniać namalowane w komputerze obszary teksturami oddającymi prawdziwe elementy natury.

GauGAN, fot. Nvidia
GauGAN, fot. Nvidia

Narzędzie wykorzystuje generatywną sieć kontradyktoryjną (GAN), czyli zbiór algorytmów sztucznej inteligencji zdolnych do samodzielnego uczenia się. I chociaż wyraźnie widać, że wygenerowane obrazy są sztuczne, to trzeba przyznać, że robią wrażenie.

Jak twierdzą twórcy, pomimo braku zrozumienia świata fizycznego, GAN mogą dawać przekonujące wyniki ze względu na ich strukturę jako współpracującej pary sieci: generatora i dyskryminatora. Generator tworzy obrazy, które przedstawia dyskryminatorowi. Wyszkolony na rzeczywistych obrazach dyskryminator uczy generator piksel po pikselu, jak poprawić realizm jego syntetycznych obrazów.

GauGAN, fot. Nvidia
GauGAN, fot. Nvidia

Twórcy podają, że wprawdzie GauGAN potrafi w obecnej formie tworzyć tylko krajobrazy złożone z ziemi, wody i nieba to jednak podstawowa sieć neuronowa może wypełniać obrazy innymi elementami, jak budynki, drogi i ludzie.

To nie pierwszy przypadek, kiedy sztuczna inteligencja tworzy obrazy wyglądające jak zdjęcia.

Rok temu NVIDIA pokazała technologię Content-Aware Fill, która wypełnia brakujące fragmenty obrazu na podstawie kontekstu, z wykorzystaniem sztucznej inteligencji. Robi to w podobny sposób, jak funkcja o identycznej nazwie znana z Photoshopa. Programu, z którego korzysta miliony fotografów, grafików czy retuszerów na całym świecie.

To jednak tylko mały fragment technologii AI NVIDIA. Kilka lat temu firma opracowała system, który generuje obrazy twarzy, wyglądające, jak normalne zdjęcia. Tymczasem są to nieistniejące w rzeczywistości twarze bazujące na zdjęciach portretowych tysięcy innych osób. W 2014 roku, kiedy system dopiero ruszał, efekty jego prac nie były zachwycające.

GauGAN
Fot. Nvidia

Wystarczyło zaledwie 5 lat, aby system wykorzystujący opisany wcześniej GAN zrobił spore postępy.

GauGAN
Fot. Nvidia

Aby stworzyć te portrety, naukowcy trenowali system sztucznej inteligencji przez tydzień, korzystając z ośmiu wydajnych procesorów. Zastosowana tu metoda jest nazywana przeniesieniem stylu. System potrafi bazować na wielu różnych zdjęciach, czerpać z nich określone elementy, kolory, cechy charakterystyczne, aby na ich podstawie tworzyć zupełnie nowe obrazy. Cechy jednego obrazu są mieszane z drugim. Pozwala to uzyskiwać imponująco realistyczne obrazy.

I wcale nie chodzi tu tylko o obrazy ludzi. Ta technologia jest w stanie generować syntetyczne obrazy przedstawiające nieistniejące wnętrza, samochody czy nawet… koty. Przynajmniej tak twierdzi firma NVIDIA. I jak im wierzę.

GauGAN
Fot. Nvidia
GauGAN
Fot. Nvidia

Już niebawem zamiast kupować zdjęcia na stockach będziemy zamawiać obrazy tworzone przez sztuczną inteligencję.

No dobrze, może troszkę się zagalopowałem. Może to nie wydarzy się tak szybko, ale kiedyś tak to może wyglądać. Zamiast tracić czas na przeglądanie setek zdjęć wykorzystywanych przez tysiące ludzi na całym świecie, będziemy zamawiać unikatowe obrazy udające zdjęcia, które przygotują nam przyszli krewni GauGAN-a.

"Skąd przychodzimy? Kim jesteśmy? Dokąd zmierzamy?" - dzieło Paula 1897
“Skąd przychodzimy? Kim jesteśmy? Dokąd zmierzamy?” – dzieło Paula Gauguina z 1897 roku jest bardziej aktualne, niż kiedykolwiek / domena publiczna.

W XIX wieku słynny francuski malarz Paul Gauguin, od którego wzięła się nazwa systemu GauGAN, tworzył wspaniałe obrazy. Artysta złapałby się za głowę, gdyby zobaczył, co wyczynia przyszywany spadkobierca jego nazwiska. A co dopiero jego następcy w przyszłości.

Dołącz do dyskusji