Pirms dažiem mēnešiem, ja gribējāt izveidot kaut ko attēlu, jums bija jāspēj zīmēt, krāsot vai izmantot kādu no fotošopinga rīkiem, par kuriem citi runā. Tomēr pēc 2022. gada viss mainījās, pateicoties AI — jā, tāpat kā "mākslīgajā intelektā".

Tā vietā, lai mēģinātu dominēt pasaulē, mākslinieciski noskaņoti AI rīki var pārvērst visu, ko jūs viņiem aprakstāt, tēlā.

Nāciet kopā ar mums, kad mēs ieejam ar AI darbināmās teksta vizualizācijas pasaulē, un uzziniet, kā varat izmantot šādus rīkus, lai pārvērstu savas domas reālos attēlos, vienkārši ierakstot to, ko domājat.

Dall-E: OpenAI GPT-3 mākslinieciskā puse

Pirmie ar AI darbināmi rīki, kas kļuva populāri, bija balstīti uz OpenAI GPT-3. Viens no iemesliem bija projekta atvērtība ārējai piekļuvei, kas izraisīja dažus ierosinājumus GPT-3 ir radošā darba nākotne.

Šodien varat izmantot oficiālos rīkus, ko varat atrast vietnē OpenAI beta vietne vai trešo pušu risinājumi, kas izmanto tās lingvistiskās lielvaras priekšrocības. Piemēram, varat lūgt GPT-3 izstrādāt ziņas melnrakstu, atbildēt uz vienkāršiem jautājumiem vai pat pārskatīt vai iztulkot kādu tekstu.

2022. gadā OpenAI atklāja, ka GPT-3 vienlīdz labi spēj veidot attēlus. DALL-E projekts, Pixar filmas WALL-E un Dalī vārda spēle, izmanto GPT-3 nevis darbam ar tekstu, bet gan kā attēlu veidošanas dzinēju.

Tāpat kā ar GPT-3 un tekstu, arī DALL-E nav īsti radošs ģēnijs, kas materializē attēlus no zila gaisa. Tā vietā tas ir "apmācīts" uz miljoniem attēlu, kas jau pastāv tiešsaistē. Tā AI spējas slēpjas šo attēlu analīzē, elementu paņemšanā no tiem, pielāgošanā, pārveidošanā, pielāgošanā un, visbeidzot, apvienošanā jaunos attēlos.

Vismaz tā ir vienkāršota versija tam, kas notiek fonā. Lielākajai daļai cilvēku rūpēs tikai tas, ko viņi redz sev priekšā, un tas ir tekstlodziņš, kurā varat kaut ko ierakstīt un redzēt, kā tas pēc dažām minūtēm tiek pārvērsts par attēlu.

Google attēla atbilde

Google ir viens no trim labākajiem "spēlētājiem" AI izpētē. Tomēr to progress nav viegli uztverams, kā arī to ieviešana produktos nav tik pieejama kā OpenAI piedāvājums.

Viena no Google AI pirmajām plaši pieejamajām ieviešanām bija Google dokumentos un Gmail viedākas automātiskās pabeigšanas un ieteikumu veidā, kas pazīstams kā viedā rakstīšana. Mēs neiedziļināsimies detaļās, jo mēs to esam iepriekš aplūkojuši Viedā rakstīšana (un kā to izmantot).

Kad šīs funkcijas ir aktīvas, Google tīmekļa lietotnes salīdzina to, ko lietotājs raksta, ar to, ko miljoniem citu rakstīja pagātnē. Pēc tam tiek ieteikts, ko viņi pēc tam ierakstīja.

Tas ir pierādījums tam, ka, neskatoties uz to, kam mums patīk ticēt, mēs neesam tik atšķirīgi. Ja 99 no 100 cilvēkiem pēc vārda “tiekamies” ieraksta “vēlāk”, iespējams, mēs arī turpinātu rakstīt.

Mēs visi esam izmantojuši kādu automātiskās pabeigšanas veidu, pat no "mēbeļu" laikmeta T9 jutīgās teksta sistēmas. Tāpēc Google AI rīki nešķita tik inteliģenti kā OpenAI GPT-3. Viņi nejutās tik daudz lietoti kā labāka T9 sistēma, kas uzlabota 21. gadsimtam. Un arī tāpēc Imagena atklājums bija neliels šoks.

Tāpat kā DALL-E uz steroīdiem, Imagen ir teksta vizualizācijas rīks. Pamatojoties uz šodien pieejamo informāciju, Imagen var radīt "tīrākus" un spilgtākus attēlus, vienlaikus zinot, kā rīkoties ar tādām uzlabotām funkcijām kā difūzija un caurspīdīgums.

Diemžēl rakstīšanas laikā piekļuve Imagen joprojām bija ierobežota, tāpēc mēs nevarējām to izmēģināt.

DALL-E Mini un draugi: atvērts biznesam

Jūs vēl nevarat brīvi piekļūt DALL-E un Imagen. Tomēr daudzas alternatīvas jau ir pieejamas, ja vēlaties muļķoties ar AI darbinātu teksta attēlu ģenerēšanu.

Paturot prātā, ka šīs ir pirmās dienas un to piedāvātie rezultāti vai lietotāja pieredze var nebūt neoptimāla, joprojām ir vērts pārbaudīt dažus no tālāk minētajiem.

Mēmu veidošana ar Dall-E Mini

Pateicoties vairāk nekā adekvātu rezultātu kombinācijai un lietotājam draudzīgam interfeisam, bet vēl svarīgāk, tā plašajai pieejamībai, DALL-E mini kļuva par vienu no populārākajiem AI teksta vizualizatoriem.

Tālu no ideāla, dažreiz DALL-E mini rezultāti varētu būt abstraktāki, nekā paredzēts.

Citreiz tas var neizdoties izveidot to, ko biji domājis, bet var būt diezgan tuvu.

Pēc straujās popularitātes pieauguma DALL-E mini veidotāji to pārcēla uz jaunu māju ar jaunu zīmolu. Tagad jūs varat atrast DALL-E mini jaunāko versiju kā Craiyon savā vietnē.

Mūsdienās Craiyon lietošana ir tikpat vienkārša kā esoša attēla meklēšana tiešsaistē. Varat apmeklēt tās vietni, teksta laukā ierakstīt sava attēla aprakstu un nospiest taustiņu Enter. Pēc kāda laika ekrānā tiks parādīti rezultāti.

Pārsteidzoši ir tas, cik labi Craiyon un līdzīgi rīki spēj atdarināt vizuālos stilus. Piemēram, mēs esam lūguši tai uzburt kucēna attēlus uz skrituļdēļa:

Pēc tam mēs izmantojām precīzu frāzi, bet pēc tās pievienojām "Pixar stilu". Pēc kāda laika Kreijons parādīja vairāk "multfilmu" attēlu, kas ir tuvāk tam, ko mēs uztveram kā Pixar staru izsekojamo grafiku viņu iemīļotajās filmās.

Craiyon mums sniedza vēl labākus rezultātus, kad tajā pašā uzvednē aizstājām "Pixar style" ar "anime style".

Anime pēc izskata ir vairāk stilizēta nekā Pixar reālistiskākie attēli, kas, šķiet, palīdzēja Craiyon radīt dažus gandrīz lietošanai gatavus attēlus.

Muļķošanās ar latentu difūziju

Latentās difūzijas modelis, kas apmācīts LAION-400M datu kopā, ir vēl viens interesants AI teksta vizualizētājs. Tomēr tā lietošana ir arī sarežģītāka. Tas ir jāpalaiž tiešsaistē virtuālajā mašīnā un jāspēlē ar dažādiem tās parametriem, nevis vienkārši jāievada teksta laukā. Tomēr tas ir vieglāk, nekā izklausās.

  1. Apmeklējiet Google Latent Diffusion sadarbības telpa šobrīd tā ir tā mājvieta.
  2. Ritiniet mazliet uz leju un ievērojiet Pamudināt lauks zem Parametri. Aizstājiet noklusējuma uzvedni ar to, ko vēlaties attēlot savā attēlā.
  3. Izvēlieties Palaist visu no Izpildes laiks izvēlni vai nospiediet CTRL + F9.
  4. Ja vēlaties iegūtos attēlus eksportēt tieši no rīka, atbildiet pozitīvi uz jautājumu, vai vēlaties to saistīt ar savu Google diska kontu. Rīka konfigurēšana aizņem kādu laiku, un procesa laikā ir jālejupielādē daži faili.

Vērtību palielināšana priekš Soļi, Iterācijas, un Paraugi_paralēli, var iegūt detalizētākus rezultātus. Tomēr rīks ir ļoti prasīgs resursiem Google serveros. Tā rezultātā tas var avarēt, ja šīs vērtības palielināsit pārāk daudz, vai arī konkrēta attēla izveides process kļūst sarežģītāks, nekā paredzēts.

Interesantas alternatīvas

Mēs esam pavadījuši ievērojamu laiku, pārbaudot DALL-E mini un Latent Diffusion. Mūsu zinātniskā metode sastāvēja no divām atšķirīgām daļām. Pirmkārt, mums bija jānāk klajā ar jēdzieniem, kurus varētu precīzi raksturot kā neprātīgus. Pēc tam palūdziet šiem AI vizualizētājiem pārvērst tos attēlos. Biežāk, nekā gaidīts, viņiem izdevās, tuvojoties vispārējam uzstādījumam, kādu bijām iecerējuši.

Mēs esam arī izmēģinājuši dažas no šī raksta pieejamajām alternatīvām. Mēs joprojām gaidām piekļuvi citiem. Daži no tiem, kurus ir vērts pārbaudīt, ir (nav noteiktā secībā):

  • Pusceļš
  • MindsEye beta
  • StarryAI
  • Sapņot
  • Disko difūzija

Vai AI radītā māksla aizstās vizuālo mākslu?

Ar AI darbināmu attēlu ģenerēšanas rīku pārpilnība un nepārtraukti pieaugošā popularitāte liek daudziem secināt, ka vizuālā māksla drīz mirs. Kāda jēga ieguldīt laiku un enerģiju, lai iemācītos zīmēt vai izmantot sarežģītu programmatūru, lai vizualizētu lietas, ja mākslīgais intelekts to var izdarīt ātrāk (un drīz arī labāk) nekā jūs?

Ja pamanījāt, visi šie rīki ir "apmācīti datu kopās". Vienkāršā angļu valodā tas nozīmē, ka viņi dara to, ko dara, pateicoties tam, ka cilvēki jau ir darījuši to pašu.

Tas ir mājiens, kāpēc šie rīki nevar aizstāt cilvēka mākslinieciskumu, radošumu un atjautību. Tie ir mīmikas, viedie replikatori. Bez cilvēku radītiem oriģināliem, par kuriem viņi ir apmācīti, viņi nevarētu ražot nekādus rezultātus.

Tomēr tas ir tagadne, un mēs atzīstam, ka nezinām, kas būs nākotnē. Pagaidām vizuālie mākslinieki var mierīgi gulēt. AI attīstās, taču daudzi šīs tēmas speciālisti piekrīt, ka nav svarīgi, vai tas kādreiz aizstās tādu cilvēku darbu kā jūs. Tas ir tikai jautājums, kad.

Bet he, tas nav viss nolemtība un drūmums. Kamēr Skynet gatavojas ieņemt mūsu darbu, mēs vismaz varam paspilgtināt savu noskaņojumu, bez piepūles veidojot kucēnu attēlus uz skrituļdēļiem!