Druga faza istraživanja usmerena je na ispitivanje odnosa između početnog vizuelnog prikaza enterijera izrađenog u SketchUp-u i konačnog AI generisanog rezultata. Polazna osnova istraživanja je fotografija, odnosno render enterijera dobijen iz SketchUp modela, koji se zatatim transformiše u ComfyUI okruženju.
Istraživanje ću započeti od jednog osnovnog workflow-a, u okviru kojeg će se kontrolisano podešavati određeni parametri i analizirati njihov uticaj na dobijeni rezultat. Na taj način moguće je pratiti kako svaka promena utiče na izgled enterijera, stepen transformacije početne slike, očuvanje geometrije prostora i kvalitet konačne vizualizacije.
Posebna pažnja usmerena je na podešavanje parametara kao što su pozitivan prompt, negativan prompt, denoise, seed, steps, cfg, scheduler i sampler name, jer oni direktno utiču na način na koji AI model interpretira početni prikaz. Kroz njihovo kontrolisano menjanje posmatra se uticaj na fotorealističnost, materijalizaciju, osvetljenje, atmosferu prostora, očuvanje osnovne geometrije i pojavu grešaka u detaljima.


1 . Pozitivan prompt u ComfyUI predstavlja opis elemenata koje želimo da generišemo na slici, kao što su stil, prostor, materijali, osvetljenje, atmosfera i detalji. Negativan prompt ima suprotnu funkciju — njime se definišu elementi koje želimo da izbegnemo u finalnom rezultatu, poput deformacija, zamućenja, loše perspektive ili neželjenih detalja. Elemente koje sam želela posebno da naglasim stavljala sam u zagrade, čime se povećava njihov značaj u procesu generisanja i model se dodatno usmerava ka željenom vizuelnom izlazu.
2 . KSampler je centralni node u workflow-u, jer se u njemu zapravo formira finalni izgled rendera. Svi prethodni nodeovi služe za pripremu slike, prompta i modela, dok nodeovi nakon njega prikazuju i čuvaju dobijeni rezultat. KSampler sadrži važne parametre kao što su seed, steps, CFG, sampler, scheduler i denoise. Njihovim podešavanjem kontroliše se koliko će se model držati prompta, koliko će menjati ulaznu sliku i koliko će finalni render biti realističan i stabilan.
- Seed predstavlja početnu numeričku vrednost koja utiče na varijaciju generisanja slike. Promenom seeda mogu se dobiti različiti rezultati iako prompt i ostali parametri ostaju isti. Nakon izbora odgovarajuće početne varijante, seed se fiksira kako bi se preciznije uporedio uticaj ostalih parametara.

Pri testiranju parametara K Sampler-a zadržaću isti pozitivan i negativan prompt, kao i fiksiran seed, kako bih mogla da sagledam pojedinačan uticaj parametara kao što su steps, scheduler, sampler name i denoise na finalni rezultat.
- Steps u K Sampler-u određuju koliko koraka AI ima da od početnog šuma postepeno formira sliku. Što je veći broj steps, model ima više vremena da razradi detalje, svetlo, teksture i kompoziciju. Optimalan broj je izmedju 20-30-40 steps.
- CFG scale određuje stepen u kom model prati zadati pozitivni i negativni prompt. Niže vrednosti omogućavaju veću slobodu interpretacije, dok više vrednosti pojačavaju usklađenost rezultata sa tekstualnim opisom. Tokom testiranja primećeno je da vrednosti u rasponu od 3 do 7 daju mekše rezultate, ali sa slabijim stepenom realizma. Nasuprot tome, vrednosti iznad 8 često dovode do prenaglašenih, agresivnih i vizuelno veštačkih prikaza.
- Sampler name označava izbor algoritma kojim model uklanja šum i formira konačnu sliku. U ComfyUI postoji velika lista različitih algoritama, a njihova promena utiče na realizam, oštrinu, teksture i stabilnost rezultata. Tokom testiranja primećeno je da DPM SDE daje najpogodnije rezultate za prikaz enterijera.


- Denoise određuje koliko će model menjati početni input, odnosno u kojoj meri će zadržati postojeću kompoziciju, geometriju i osnovne odnose slike. Tokom testiranja primećeno je da i pri optimalnim nižim vrednostima do 0.35, kada model maksimalno prati osnovni input, render ne daje zadovoljavajuću vizuelizaciju, dok previsoke vrednosti dovode do prevelikog odstupanja i nestabilnog rezultata.


- Ako steps određuje koliko koraka proces ima, a sampler name kojim algoritmom se radi, onda scheduler određuje kojim tempom će se šum smanjivati kroz te korake. Njegov izbor utiče na stabilnost, oštrinu, detalje i opšti karakter finalnog rendera, a tokom testiranja primetila sam da Beta i Karras scheduler daju najpogodnije rezultate za vizuelizacije enterijera.


Analizom parametara i dobijenih rezultata u ComfyUI-u može se zaključiti da osnovni workflow za generisanje rendera enterijera ima ograničenja u pogledu efikasnosti i kvaliteta. Postizanje zadovoljavajućeg rezultata zahteva veliki broj pokušaja, različitih varijacija i podešavanja parametara, što proces čini vremenski zahtevnim i nedovoljno praktičnim. Zbog toga se može zaključiti da je za postizanje kvalitetnijih i kontrolisanijih vizuelizacija neophodno usložnjavanje workflowa i primena naprednijih metoda obrade.

Render enterijera generisan u ChatGPT-u na osnovu jednog tekstualnog prompta.
