Google-ovi stručnjaci za veštačku inteligenciju nadogradili su sistem koji stvara ilustracije na osnovu teksta tako da je on u stanju kao rezultat da izbaci i trodimenzionalni model
Google-ov text-to-image difuzijski model Imagen, koji je treniran tako da prepoznaje naredbe zadate prirodnim jezikom te iz njih stvara fotorealistične ilustracije, dobio je nadograđenu verziju. Njeno ime je DreamFusion, a na osnovu istih podataka za treniranje sada može kao rezultat da izbaci trodimenzionalni model „izmaštanog“ objekta. Kao i kod ostalih sistema slične namene, koji tekst pretvaraju u slike ili video, i kod ovog modela sve što treba da učiniti jeste da opišete ono što želite da dobijete, a Google-ova veštaćka inteligencija odradiće ostalo.
3D iz 2D
Zanimljivo je da sistem nije trebalo posebno trenirati na 3D modelima, već se za dobijanje trodimenzionalnog rezultata koriste dvodimenzionalni renderi iz više uglova, koje sistem potom spaja u 3D model. Tako dobijen model moguće je razgledati sa svih strana, menjati mu osvetljenje ili ga ugraditi u neku veću 3D scenu. Neke primere rezultata ovako dobijenih 3D ilustracija možete pogledati na stranicama projekta, pre nego što postanu javno dostupni.
Dodatnu korist ovom sistemu daje i činjenica da je generisane modele moguće izvesti u obliku pogodnom za korišćenje u softverima za 3D modeliranje. Tamo se mogu doraditi, obraditi i modifikovati, a odatle ih potom i odštampati na 3D štampaču.
IZVOR: bug.hr