:

Szerző: Bőle György

2023. január 18. 14:20

Stable Diffusion: szövegből kép generálás a gyakorlatban

Az emberiség összes vizuális információja néhány gigabájtba tömöríthető, ennyiből előállítható az összes lehetséges kép - állítja a Stable Diffusion fejlesztője.

Szeptemberben nagy port kavart az a hír, hogy egy mesterséges intelligencia által generált képpel nyertek meg egy művészeti versenyt. Emiatt a text-to-picture, azaz a szövegből kép generálás AI segítségével nagy média figyelmet kapott az elmúlt időszakban. Mindez a gépi tanulás területén megjelent új megközelítésnek, a deep learning tömeges megjelenésének köszönhető, amelynek a képgenerálás mindössze csak egy szemléletes felhasználási módja, mert a lehetőségek korlátlanok.

Ünnepi mix a bértranszparenciától a kódoló vezetőkig

Négy IT karrierrel kapcsolatos, érdekes témát csomagoltunk a karácsonyfa alá.

Ünnepi mix a bértranszparenciától a kódoló vezetőkig Négy IT karrierrel kapcsolatos, érdekes témát csomagoltunk a karácsonyfa alá.

Litkei Péter (Deepnetworks) a HWSW free! meetup-sorozat machine learning állomásán elhangzott és alább megtekinthető előadásában a deep learning megközelítést mutatja be a szövegből kép generálással. Ehhez a Stability.ai által publikált betanított hálózatot használja, ami szemben az olyan megoldásokkal, mint a DALL-E 2, teljesen open source projekt, így képes akár saját eszközeinken vagy éppen saját szolgáltatásainkkal képek generálására.

17:32
 

Szövegből kép generálás a gyakorlatban (Stable Diffusion)

Még több videó
a címlapról