Ar dirbtinio intelekto sistemos, tokios kaip DALL-E ar Midjourney, gali atlikti kūrybines užduotis?

Pastaruoju metu matome didelį vaizdų kūrimo procesą. Pastarasis mašininio mokymosi ir dirbtinio intelekto antplūdis ir augimas kelia klausimų apie tai, kaip kūrybiniai procesai vystosi ir vystosi pasitelkiant technologijas. Tokios sistemos kaip DALL-E, DALL-E 2 ir Vidurinė kelionė yra AI programos, išmokytos generuoti vaizdus iš teksto aprašymų, naudojant teksto ir vaizdo porų duomenų rinkinį. Įvairių galimybių rinkinys apima antropomorfizuotų gyvūnų ir objektų versijų kūrimą, nesusijusių sąvokų derinimą patikimais būdais ir esamų vaizdų transformacijų taikymą.
DALL-E ir panašios sistemos gali sukurti patikimus vaizdus įvairiems sakiniams, tyrinėjantiems kalbos kompozicinę struktūrą. DALL-E turi tam tikras galimybes 3D atvaizdavimas variklis, tačiau skirtumas slypi įvesties pobūdyje. Dėl 3D atvaizdavimas, įvestis turi būti nurodyta visiškai išsamiai, o DALL-E dažnai gali „užpildyti tuščias vietas“. Jis taip pat gali savarankiškai valdyti nedidelio skaičiaus objektų atributus.

Viena iš įdomiausių savybių yra galimybė derinti nesusijusias sąvokas. Šis gebėjimas gali turėti įtakos architektūros ir dizaino sritims, taip pat architektūrai ir gaminių dizainui semtis įkvėpimo iš iš pažiūros nesusijusių koncepcijų. AI generuojantys modeliai skatina dizainerius ištirti daugiau dizaino galimybių iš naujos perspektyvos, nes tai sumažina laiką nuo ketinimo iki įgyvendinimo. Jie siūlo prieinamą būdą žaisti su duomenimis ir generuoti kūrybiškų problemų sprendimų variantus.
Susijęs straipsnis
Metaverse kaip galimybė architektams: interviu su Patriku Schumacheriu
Kai kurie tyrinėtojai tai vadina “Dirbtinis serendipizmas“, sistemas, kurios maksimaliai padidina galimybę patirti ramybę, atverdamos kūrybinių galimybių spektrą už klasikinių metodų ribų. Architektai jau eksperimentuoja su šiais įrankiais, kad ištirtų tokias sudėtingas problemas kaip miesto planavimas ir esamų erdvių galimybes. Kiti architektūrinius raktinius žodžius derina su šiuolaikinio dizaino klišėmis, nuorodomis į popkultūrą ir įvairius meno stilius, kurdami pastatus ar tiesiog tyrinėdami dizaino tendencijas ir technologijas.

Nors šie modeliai turi apribojimų, sritis vystosi neregėtu greičiu. Neseniai „Apple“ išleido Gaudi, „neuronų architektas“, kuris žengia dar vieną žingsnį į šį procesą kurdamas 3D scenas iš teksto raginimų, pvz., „lipk aukštyn“ arba „eik per koridorių“. Sunku nuspėti, kur šie pokyčiai mus nuves, bet jų poveikis jau jaučiamas. Architektūros ir dizaino srityse tai gali būti suprantama kaip galingi įrankiai, skirti greitai tyrinėti, optimizuoti ir išbandyti kūrybinius dizainus.
