
Počela sam testiranje AI rendera koristeći jednostavan oblik kocke. Cilj je bio da proverim kako različiti renderi funkcionišu sa jednostavnim zadacima, kako bih znala sa kojima je najbolje da nastavim rad u narednoj fazi.

Prvo sam počela sa programom Look X AI. Zadala sam mu da doda materijal drveta na kocku, pri čemu je sve ostalo trebalo da ostane nepromenjeno, uključujući geometriju, oblik, veličinu, poziciju i ugao slikanja. Na početku, program nije uspevao da zadrži zadatu geometriju kocke i dodavao je dodatne elemente, ali je uspešno primenio drveni materijal. Prvobitno sam koristila Generate Model Gen2, a prelaskom na Gen3 rezultati su se značajno poboljšali, što se može videti na priloženim slikama. Takođe, bilo je važno da u opciji Base Image Similarity postavim što viši faktor kako bi se geometrija zadržala. Ispitivala sam više verzija prompta kako bih postigla optimalne rezultate. Nakon više pokušaja, uspela sam da zadržim oblik kocke, ali materijal drveta nije bio primenjen.

Sledeći pokušaj je uključivao manju izmenu prompta, što je dovelo do postizanja željenog rezultata.

Zatim sam se konsultovala sa profesorom i zaključili smo da će biti korisno da nastavim testiranje sa složenijom kompozicijom kako bih preciznije procenila rad AI rendera. Odlučila sam da isprobam sa tri tela: cilindrom, kockom i konusom, pri čemu bih svakom dodelila različite materijale. Ovako je izledao početan linijski crtež:

Nastavila sam rad u istom programu, ali je materijal metala pravio poteškoće, pa sam više puta prilagođavala promptove kako bih se približila željenim rezultatima. Za prvi slučaj prompt je glasio: Photorealistic rendering of three separate objects: a cube made entirely of wood, a cylinder made entirely of glass, and a cone made entirely of metal. Keep exact geometry, dimensions, position, and camera angle for each object. Tada je konus, umesto metala, primio materijal stakla. Za drugi slučaj prompt je glasio : Photorealistic rendering: a cube made of glass, a cylinder made of wood, and a cone made of gray metal. Keep exact geometry, dimensions, position, and camera angle for each object. Tu je konus dobio tamniju nijansu, koja je i dalje podsećala na staklo. Za treći slučaj prompt je glasio: Photorealistic rendering: a cube made of glass, a cylinder made of wood, and a cone made of dark gray metal. Keep exact geometry, dimensions, position, and camera angle for each object. Tada je siva boja greškom prešla na drveni materijal, iako to nije bilo zadato.

Nastavila sam sa eksperimentisanjem sa različitim formulacijama u promptu i uspela sam da dođem do željenog rezultata. Iako su u pitanju bile samo nijanse, istraživanje je pokazalo da čak i male promene u promtu značajno utiču na to da li AI uspešno generiše željeni rezultat, što proces renderovanja čini veoma nepredvidljivim. Ovako je glasio taj prompt: Photorealistic rendering: a cube made of glass, a cylinder made of wood, and a cone made of aluminum metal. Keep exact geometry, dimensions, position, and camera angle for each object.

Sledeći program koji sam ispitala bio je Prome AI. Od tri generisane slike, jedna je bila približno tačna, osim što je na staklenoj kocki neprirodno prikazao refleksiju drvenog cilindra. Ovde je bilo važno da smanjim parametar Creativity na niže vrednosti, kako AI ne bi imao previše slobode da menja ili dodaje elemente. To je bilo ključno, jer sam želela da zadržim geometriju, oblike, dimenzije i pozicije figura. Takođe, parametar Artistry podešava koliko AI dodaje stilizovane ili umetničke elemente; veća vrednost može promeniti izgled i strukturu objekata, dok manja vrednost zadržava realističniji i precizniji rezultat. Za moj zadatak, manja vrednost Artistry-ja bila je pogodnija, jer je omogućila da geometrija ostane ista.

Zatim sam testirala Rerender AI, koji se pokazao kao veoma kvalitetan alat, ali nije uspevao da ukloni pozadinu koju je automatski dodavao, i pored stalnih instrukcija da to ne čini. Ovde je bilo važno koristiti opciju Precise, kako bi geometrija, oblici, dimenzije i pozicije objekata ostale nepromenjene. Ipak, bilo je neophodno veoma dobro naglasiti ove zahteve i u promptu, jer, za razliku od nekih drugih rendera, ovaj nema dodatne parametre koji to mogu kontrolisati. Kod Prome AI to su bili Creativity i Artistry, dok je kod Look X AI to funkcionisalo kroz Base Image Similarity.

Sledeći program koji sam ispitala bio je mnml ai, koji je vrlo precizno generisao kocku, ali nije uspeo da pravilno izvrši zadatak sa tri različita oblika. Ovde je bilo važno odabrati opciju Exact Render i postaviti skalu bliže Precise, kako bi geometrija objekata bila sačuvana. Takođe, bilo je neophodno selektovati opciju za realističan prikaz materijala. Pored samog prompta, ovi parametri bili su ključni za ostvarenje željenog rezultata.

Zatim sam testirala Stable Diffusion, koji sam prethodno instalirala da radi lokalno na mom laptopu. Međutim, nije se pokazao dobro za zadatak sa tri objekta, jer nije uspevao da generiše ništa ni približno tačno, iako sam pokušavala da menjam parametre i promptove.
Isprobala sam i Inpaint i Image2Image funkcije:
- Inpaint – služi za izmenu ili popravku određenog dela slike bez menjanja ostatka.
- Image2Image – koristi postojeću sliku kao osnovu i generiše novu verziju prema promptu, zadržavajući osnovne oblike i strukturu, ali menja stil, materijal ili detalje.
Kod parametara najviše sam menjala vrednosti sledećih:
- CFG Scale – određuje koliko striktno AI prati zadati prompt; veća vrednost znači da AI više prati uputstvo, manja vrednost mu daje više slobode.
- Denoising Strength – reguliše koliko AI ima slobode da menja originalnu sliku; veća vrednost daje više slobode, dok manja zadržava više originalnih oblika, dimenzija i pozicija. Za moj slučaj je bilo bolje koristiti manju vrednost kako AI ne bi menjao oblike, dimenzije i pozicije.
- Sampling Steps – broj koraka u procesu generisanja slike; veći broj koraka povećava preciznost rendera i kvalitet detalja.
I pored podešavanja svih ovih parametara, Stable Diffusion nije uspeo da zadatak sa tri objekta ispuni kako je trebalo.

Prethodna dva, iznad navedena, rendera; Stable Diffusion i mnml ai, pokazala su se slabije u odnosu na ostale alate. To je mogućeiz razloga što su ovi modeli prvenstveno osmišljeni i trenirani za generisanje poznatih objekata, kao što su kuće i slične realistične scene. Na zadatku sa geometrijskim oblicima, poput kocke, cilindra i konusa, AI modeli se suočavaju sa većom složenošću, jer nisu dovoljno trenirani na takvim zadacima. Zbog toga i pored preciznog prompta i podešavanja parametara, generisanje željenih rezultata postaje nepredvidljivo i često neuspešno.
Ovo istraživanje mi je omogućilo da detaljnije razumem način na koji ovi AI programi funkcionišu, koje su njihove snage i slabosti, kao i šta mogu realno očekivati u narednoj fazi istraživanja kada budem dalje testirala njihove mogućnosti i granice u arhitektonskoj vizualizaciji.
