A ChatGPT előnyeivel erősít a DALL-E új verziója
Már azt sem kell kitalálnia a felhasználónak, milyen kulcsszavakat adjon meg a képgenerátornak, azt is megcsinálja helyette az MI: ChatGPT-integrációval bővült a képgenerátor DALL-E.
Az OpenAI bejelentette képgeneráló szolgáltatása, a DALL-E harmadik verzióját, aminek egyik fő újdonsága a startup másik generatív alkalmazása, a ChatGPT integrációja. A felhasználók már a chatbotot is megkérhetik arra, hogy segítsen a legjobb szöveges promptok kiválasztásában, ami az elképzeléseiknek legmegfelelőbb képet eredményezhetik a DALL-E szolgáltatásában.
A fejlesztők szerint az új művészkedős MI már sokkal jobban megérti a kontextust is, míg korábban előfordult, hogy gyakran figyelmen kívül hagyott konkrét szöveges utasításokat az illusztrációk generálása során. Ez azt jelenti, hogy a DALL-E 3 esetében már túl sokat nem is kell gondolkodnia a felhasználónak az utasításokkal kapcsolatban, mert már ezt a feladatot elvégezheti helyette egy MI: egyenesen a ChatGPT felületén belül írhatják be a képre vonatkozó kérést, amit az okosított DALL-E rögtön értelmez.
A Gitlab mint DevSecOps platform (x) Gyere el Radovan Baćović (Gitlab, Data Engineer) előadására a november 7-i DevOps Natives meetupon.
A DALL-E első verziója 2021-ben vált elérhetővé, megelőzve a Stability AI és a Midjourney szolgáltatásokat, amik szintén szövegből készítenek képeket és illusztrációkat az alattuk nyugvó generatív modellek segítségével. A szolgáltatás második verziója 2022-ben érkezett, ekkor már várólistát kellett nyitnia az OpenAI-nak az élénk érdeklődés miatt, ami tavaly szeptemberben szűnt meg, azóta bárki használhatja a programot. Az új kiadás októberben válik elérhetővé a ChatGPT Plus és a ChatGPT Enterprise felhasználói számára, utána következnek a kutatólaboratóriumok és az API-kat alkalmazó ügyfelek. Egyelőre nincs ütemterv arra vonatkozóan, hogy az ingyenes nyilvános verzió mikor lesz hozzáférhető.
Az OpenAI túl sok technikai információt egyelőre nem osztott meg az új rendszerrel kapcsolatban, inkább a gyakorlatbeli alkalmazásban történt előrelépésekről ejtett szót a bejelentésben. A fejlesztők elmondása szerint a korábbi tanulságokat leszűrve tovább fejlesztette rendszerét annak érdekében, hogy megakadályozza a potenciálisan gyűlöletkeltő, agresszív képek létrehozását és a korábban már jelentett torzításokat. Ehhez olyan külső csapatok segítségét kérte, akik szándékosan próbálták megtörni a rendszert, végül sikerült olyan megoldásokat építeni a nagy nyelvi modellbe, aminek köszönhetően az figyelmen kívül hagyja az erőszakos utasításokat, különösen ha egy konkrét személy neve társul hozzá. A további biztonsági intézkedésekkel pedig azt is próbálják megelőzni a fejlesztők, hogy a DALL-E 3 élő művészek stílusát másolja és utánozza, ellenben a DALL-E 2 felszólításra eddig is képes volt erre.
Az esetleges jövőbeli perek elkerülése érdekében az OpenAI megadja a lehetőséget a művészek számára, hogy kérjék alkotásaik letiltását a szöveg-kép generátorban való felhasználásra, ezt a cég weboldalán létrehozott dedikált űrlapon keresztül kérvényezhetik majd.