Dette AI-neurale nettverket fra Nvidia skaper fotorealistiske falske bilder

$config[ads_kvadrat] not found

Den sanne historien om Paris Hilton | Dette er Paris Hilton Offisiell dokumentar

Den sanne historien om Paris Hilton | Dette er Paris Hilton Offisiell dokumentar
Anonim

På et øyeblikk ser bildet opp som et vanlig bilde av en vanlig gate, tatt enten fra et dash-kamera eller fra noen dumme nok til å vandre inn i veien for å få et bilde av en slik verdslig scene.

Men se litt nærmere. Legg merke til hvordan trafikksignalet er litt krøllet, eller hvordan noen av bilene virker uklar? Det er noe galt her. Dette er ikke et fotografi i det hele tatt. Det er et bilde som ble opprettet helt av en A.I.

Datavitenskapere fra teknologibedriften Nvidia og University of California, Berkeley, har skrevet et forskningspapir, tilgjengelig i preprint på arXiv, og beskriver hvordan de kunne få et neuralt nettverk for å generere realistiske streetbilder og menneskelige portretter. De inkluderte selv et brukergrensesnitt som lar deg finjustere bildene, men du vil gjerne legge til ekstra løvverk eller til og med endre vær.

"Gaming vokser raskt, fordi folk elsker å samhandle med hverandre i virtuelle miljøer, forteller Ming-Yu Liu, seniorforsker ved Nvidia, Omvendt i en e-post. "Det er imidlertid dyrt å bygge virtuelle verdener med dagens teknologi, fordi det krever at kunstnere eksplisitt modeller og simulerer tekstur og belysning for verden de bygger. Med bilde-til-bilde-oversettelse kan vi i stedet prøve den virkelige verden for å skape virtuelle verdener."

Nevrale nettverk er datamaskiner som er modellert for å fungere som en menneskelig hjerne ved å ta inn informasjon, bruke den og lære av resultatene. Denne undersøkelsen brukte spesielle typer neuralnett introdusert av Ian Goodfellow i 2014, kalt generative adversarielle nettverk - eller GANs - som vanligvis består av to nettverk, generatoren og diskriminatoren.

Generatoren er gitt bilder og begynner å lage syntetiske bilder som ligner på den som ble gitt. Det viser så en blanding av bildene den ble gitt og falskene til diskriminatoren, hvis jobb det er å fortelle dem fra hverandre. Når denne prosessen går videre, blir generatoren bedre til å etterligne de opprinnelige bildene, og diskriminatoren blir bedre til å fortelle feilene fra hverandre. Resultatene er noen ganske overbevisende - og helt falske bilder.

Denne undersøkelsen bygger på den tradisjonelle GAN-modellen ved å legge til splitter generatoren og diskriminatornettene i noen få subnettverk, slik at det blir mulig å få utdata med høyere oppløsning. Neuralnettene kan også ta et semantisk kart - eller en tegning av hvordan bildet skal se ut - og fylle ut teksturene autonomt. Brukere kan til og med gå inn i tegningen og endre ting hvis de vil legge til bygninger i stedet for trær i gatevisning eller gjøre øynene bredere i et portrett.

Papiret sammenligner sine resultater med lignende eksperimenter gjort ved hjelp av denne metoden, den mest bemerkelsesverdige er pix2pix. Nvidia og UC Berkeley-studien kan generere bilder med detaljer som små og presise som lesbare lisensplater, mens pix2pix utfører bilder som nesten ser ut som akvarellmalerier.

Mens dette verktøyet kan brukes til å tjene litt gratis reddit karma med et par utlandsk bilder, ser forfatterne stort potensial i å utnytte denne tilnærmingen for å generere realistisk grafikk med bare en enkel utskrift.

Hundrevis av timer med omhyggelig arbeid går inn i å generere virtuelle verdener for bruk i Google Maps, filmer og videospill. Liu sier at denne modellen kan tjene som en måte å smertefritt få mesteparten av designen ut, og deretter gå inn og justere detaljene senere.

"I stedet for å gjengi verden ved å eksplisitt modellere den, kan vi bygge verden implisitt ved å bruke bilde til bilde oversettelse for å oversette mellom en enkel modell av verden som ikke inneholder noen tekstur eller belysning, og en fotorealistisk utgang. Denne evnen skal gjøre det mye billigere å bygge virtuelle verdener, forteller han Omvendt.

For neste trinn i denne undersøkelsen håper teamet å utforske video-til-video oversettelse, som ville bruke neuralnett for å skape realistiske videoer. Et mål som Lui sier har utfordret forskere i feltet.

Nå vet du hvor lett falske bilder kan opprettes. Ikke stol på alt du ser på Google-bilder.

$config[ads_kvadrat] not found