Kezdőoldal » Számítástechnika » Programok » Hogyan lehet a mesterségees...

Hogyan lehet a mesterségees intelligenciával képeket készíttetni/rajzoltatni?

Figyelt kérdés

Rövid idő alatt egy csomó képet dobott fel pl. a facebook AI által készített autó/ház/erotikus/tájkép/stb. témában. Hogyan készül, hogyan lehet készíttetni ilyet? Továbbá, hogyan lehet beszédet/fogalmazást/novellát/stb. iratni?

#robotika #Mesterséges Intelligencia

febr. 3. 14:32

1/7 anonim

válasza:

Az utóbbi hónapok (évek?) százmillió pont ugyanilyen kérdéséből mi nem tetszett?

febr. 3. 14:42

Hasznos számodra ez a válasz?

2/7 Zcom09 válasza:

Ez egy elég szerteágazó téma. Mindegyik egy teljesen külön világ, a kép, hang, szöveg generálsás mind teljesen különálló dolgokat igényel (bár vannak próbálkozások amik ötvözik ezeket). Mindegyikről több oldalas összefoglalót lehetne írni, pontosabban mi érdekel? Hogy milyen programok kellenek hozzá, vagy hogy hogyan készítik magukat a képeket/hangot/szöveget?

febr. 3. 14:46

Hasznos számodra ez a válasz?

3/7 A kérdező kommentje:

Köszi. A működés érdekelne.

Pl. Készítsen képet egy Citroen DS/VW bogár újragondolásáról. Vagy erdei házikó stb. Hoyan kell elindulni. Ez egy applikáció? Egy weboldal? Egyáltalán hogyan kell nekiállni? Vagy a szövegírásnak?

febr. 3. 16:50

4/7 anonim

válasza:

Van applikáció is, weboldal is... Mindjourney, DALL-E, stb.

febr. 3. 17:12

Hasznos számodra ez a válasz?

5/7 A kérdező kommentje:

Köszi, megnézem!

febr. 3. 17:14

6/7 anonim

válasza:

A Midjourney, Dall-E, Stable Diffusion programok/webes szolgaltatások. Ezek képgenerálásra vannak, a stable diffusion algoritmussal.

Az alapjuk az, hogy neurális hálóval már egészen jól fel lehet ismerni, hogy egy képen mi van. Nagyon leegyszerűsítve: kiindul valami random szemétből, és úgy javítja a képet, hogy minél inkább hasonlítson arra, amit beírtál. (wikipedián van róla leírás)

Van egy régebbi algoritmus, a GAN (Generative Adversarial Networks). Ez arra jó, hogy sok bemenetből (pl. képből) generáljon egy újat. Itt két neurális hálót tanítanak fel: az egyik valami random bemenetből megpróbál új képeket generálni, a másik meg megpróbálja felismerni, hogy eredeti képet lát, vagy hamisítványt. Egymás ellen dolgoznak, az előbbi egyre jobb képeket generál, a másik meg egyre jobb lesz a felismerésében.

A ChatGPT, Bard, meg a Bing chatje LLM-re (Large Language Model) épülő AI asszisztens. Ezek jók szöveggenerálásra. A legjobban talán Andrej Karpathy youtube-os videosorozata magyarázza el. Nagyon leegyszerűsítve: összegyűjtöttek egy nagy rakás szöveget. Ezt tokenekre bontják (szavak/szótagok/betűk számokból álló vektorokkal reprezentálva), ez megy be a neurális hálóra tanításkor. A Google Translate-hez is használt Transformer modelt használják (az egyik felét, mert itt nincs fordítási lépés), innen jön a neve: Generative Pretrained Transformer. A szöveget tokenenként kapja meg tanításkor (az utolsó N darabot), és mindig a következő tokent kell kitalálnia. Generáláskor mindig ad egy-egy tokent, ami a korábbi szöveg végére kerül, és megy vissza a háló elejére. Így egyre hosszabb szövegeket generál tokenenként.

Tanításkor a végén van egy plusz csavar: kérdés-válasz párokat kap, így megtanulja, hogy kérdés után válasz következik. Emiatt jó asszisztensnek is (mert így választ fog generálni), illetve emiatt van, hogy ha megkéred, hogy írjon szöveget adott témáról, akkor azt fogja tenni. Sajnos van egy jelenség, a hallucináció, arra is megpróbál valami válasznak tűnőt válaszolni, amire nincs jó válasz. Emiatt "hazudik", meg kitalál dolgokat. Szóval ésszel kell használni.

febr. 3. 19:39

Hasznos számodra ez a válasz?

7/7 A kérdező kommentje:

Hú, ez nagyon érdekes és érthető volt! Köszönöm!

febr. 3. 21:24

Kapcsolódó kérdések:

A robotikát kutatók mivel bizonyítják 100%-ra, hogy a mesterséges intelligencia biztosan nem fog kikerülni az emberiség uralma alól, és nem fordul ellene?

Ha végzős gimnazisták lennétek, és mindkét irány érdekelne, akkor melyiket választanátok a továbbtanulás céljából, kvantumszámítást (kvantum számítógépek) vagy a...

Miért gondolja rengeteg ember, hogy a különböző analysteket (Data, BI) nem fogja a mesterséges intelligencia éveken belül leváltani?

Az önkiszolgáló kassza miért kér borravalót? Valamilyen marketingfogás ez vagy az MI lehet benne?

Melyik mesterséges intelligencia képes erre?

Lehetséges hogy az első öntudatra kelt mesterséges intelligencia belátja azt amit mi nem merünk, névlegesen azt hogy a létezés csupán egy értelmetlen szenvedés,...

Számítástechnika főkategória kérdései »

Számítástechnika - Programok kategória kérdései »

A weboldalon megjelenő anyagok nem minősülnek szerkesztői tartalomnak, előzetes ellenőrzésen nem esnek át, az üzemeltető véleményét nem tükrözik.
Ha kifogással szeretne élni valamely tartalommal kapcsolatban, kérjük jelezze e-mailes elérhetőségünkön!