Kezdőoldal » Számítástechnika » Programok » Hogyan lehet a mesterségees...

Hogyan lehet a mesterségees intelligenciával képeket készíttetni/rajzoltatni?

Figyelt kérdés
Rövid idő alatt egy csomó képet dobott fel pl. a facebook AI által készített autó/ház/erotikus/tájkép/stb. témában. Hogyan készül, hogyan lehet készíttetni ilyet? Továbbá, hogyan lehet beszédet/fogalmazást/novellát/stb. iratni?

febr. 3. 14:32
 1/7 anonim ***** válasza:
64%
Az utóbbi hónapok (évek?) százmillió pont ugyanilyen kérdéséből mi nem tetszett?
febr. 3. 14:42
Hasznos számodra ez a válasz?
 2/7 Zcom09 válasza:
Ez egy elég szerteágazó téma. Mindegyik egy teljesen külön világ, a kép, hang, szöveg generálsás mind teljesen különálló dolgokat igényel (bár vannak próbálkozások amik ötvözik ezeket). Mindegyikről több oldalas összefoglalót lehetne írni, pontosabban mi érdekel? Hogy milyen programok kellenek hozzá, vagy hogy hogyan készítik magukat a képeket/hangot/szöveget?
febr. 3. 14:46
Hasznos számodra ez a válasz?
 3/7 A kérdező kommentje:

2

Köszi. A működés érdekelne.

Pl. Készítsen képet egy Citroen DS/VW bogár újragondolásáról. Vagy erdei házikó stb. Hoyan kell elindulni. Ez egy applikáció? Egy weboldal? Egyáltalán hogyan kell nekiállni? Vagy a szövegírásnak?

febr. 3. 16:50
 4/7 anonim ***** válasza:
Van applikáció is, weboldal is... Mindjourney, DALL-E, stb.
febr. 3. 17:12
Hasznos számodra ez a válasz?
 5/7 A kérdező kommentje:
Köszi, megnézem!
febr. 3. 17:14
 6/7 anonim ***** válasza:
100%

A Midjourney, Dall-E, Stable Diffusion programok/webes szolgaltatások. Ezek képgenerálásra vannak, a stable diffusion algoritmussal.

Az alapjuk az, hogy neurális hálóval már egészen jól fel lehet ismerni, hogy egy képen mi van. Nagyon leegyszerűsítve: kiindul valami random szemétből, és úgy javítja a képet, hogy minél inkább hasonlítson arra, amit beírtál. (wikipedián van róla leírás)

Van egy régebbi algoritmus, a GAN (Generative Adversarial Networks). Ez arra jó, hogy sok bemenetből (pl. képből) generáljon egy újat. Itt két neurális hálót tanítanak fel: az egyik valami random bemenetből megpróbál új képeket generálni, a másik meg megpróbálja felismerni, hogy eredeti képet lát, vagy hamisítványt. Egymás ellen dolgoznak, az előbbi egyre jobb képeket generál, a másik meg egyre jobb lesz a felismerésében.

A ChatGPT, Bard, meg a Bing chatje LLM-re (Large Language Model) épülő AI asszisztens. Ezek jók szöveggenerálásra. A legjobban talán Andrej Karpathy youtube-os videosorozata magyarázza el. Nagyon leegyszerűsítve: összegyűjtöttek egy nagy rakás szöveget. Ezt tokenekre bontják (szavak/szótagok/betűk számokból álló vektorokkal reprezentálva), ez megy be a neurális hálóra tanításkor. A Google Translate-hez is használt Transformer modelt használják (az egyik felét, mert itt nincs fordítási lépés), innen jön a neve: Generative Pretrained Transformer. A szöveget tokenenként kapja meg tanításkor (az utolsó N darabot), és mindig a következő tokent kell kitalálnia. Generáláskor mindig ad egy-egy tokent, ami a korábbi szöveg végére kerül, és megy vissza a háló elejére. Így egyre hosszabb szövegeket generál tokenenként.

Tanításkor a végén van egy plusz csavar: kérdés-válasz párokat kap, így megtanulja, hogy kérdés után válasz következik. Emiatt jó asszisztensnek is (mert így választ fog generálni), illetve emiatt van, hogy ha megkéred, hogy írjon szöveget adott témáról, akkor azt fogja tenni. Sajnos van egy jelenség, a hallucináció, arra is megpróbál valami válasznak tűnőt válaszolni, amire nincs jó válasz. Emiatt "hazudik", meg kitalál dolgokat. Szóval ésszel kell használni.

febr. 3. 19:39
Hasznos számodra ez a válasz?
 7/7 A kérdező kommentje:

6

Hú, ez nagyon érdekes és érthető volt! Köszönöm!

febr. 3. 21:24

Kapcsolódó kérdések:





Minden jog fenntartva © 2024, www.gyakorikerdesek.hu
GYIK | Szabályzat | Jogi nyilatkozat | Adatvédelem | Cookie beállítások | WebMinute Kft. | Facebook | Kapcsolat: info(kukac)gyakorikerdesek.hu

A weboldalon megjelenő anyagok nem minősülnek szerkesztői tartalomnak, előzetes ellenőrzésen nem esnek át, az üzemeltető véleményét nem tükrözik.
Ha kifogással szeretne élni valamely tartalommal kapcsolatban, kérjük jelezze e-mailes elérhetőségünkön!