2024. december 12. 13:15

Bemutatkozott a Google Gemini 2.0

A keresőóriás második generációs multimodális technológiája a szövegek mellett képes szóbeli és vizuális inputok alapján is dolgozni, képet és hanggenerálást is támogat.

Ismét egymásra licitálnak a generatív mesterséges intelligencia piacán versengő óriások: alig egy héttel azután, hogy az OpenAI nyilvánosan elérhetővé tette o1 modelljét és a Sora videógenerátort, a Google bejelentette az egyelőre előnézeti verzióban hozzáférhető újgenerációs Gemini 2.0 modellt. Sundar Pichai vezérigazgató bejegyzése szerint a 2.0 egyik fő előrelépése elődjéhez képest, hogy natív támogatást kínál kép- és audiókimenet létrehozásához.

A keresőóriás némileg stratégiát váltott, és először nem a Gemini 2.0 legfejlettebb Pro változatát vezeti be, hanem a hatékonyabb és olcsóbb 2.0 Flash modellt, ami minden felhasználó számára hozzáférhető mobilalkalmazáson és webes kliensen keresztül. A Gemini 2.0 Flash a versenyszintű matematikai feladatok megoldására való képességet mérő HiddenMath tesztjén 63 százalékos értékelést kapott, ami előrelépés a Gemini 1.5 Flash által teljesített 47,2 százalékhoz képest.

goglegemin

USA Tech Hub: ahonnan a passzátszél fúj

Minden, ami a technológiai szektorban történik, jellemzően az USA-ból indul.

USA Tech Hub: ahonnan a passzátszél fúj Minden, ami a technológiai szektorban történik, jellemzően az USA-ból indul.

Az új modell több téren túlteljesíti a 10 hónapja bemutatott Gemini 1.5 Pro-t, mindössze egy területet lehet kiemelni, ahol gyengébb, ez pedig a hosszabb szövegek megértése és az automatikus beszédfordítás. A keresőóriás ezért sem fogja kivezetni a korábbi modellt a szolgáltatásai listájáról. A Gemini 2.0 emellett képes együttműködni harmadik féltől származó alkalmazásokkal, a cég által közzétett videón például látható, amint egy többlépcsős folyamaton keresztül a tervezéstől indulva segít egy webes vásárlás elvégzésében a felhasználónak.

A többi vállalathoz hasonlóan a Google is gyakorlatilag minden saját termékébe beépíti saját AI-technológiáját, és próbál olyan termékeket fejleszteni, amelyeket más fejlesztők is használni szeretnének. Mindeközben versenyeznek a rendkívül költséges üzemeltetést hatékonyabbá tevő infrastruktúra kiépítésén. Az Amazon, a Microsoft, az Anthropic és az OpenAI szintén milliárdokat öntenek bele nagyjából ugyanezekbe a kihívásokba.

A Google nem titkolt célja, hogy a 2.0 modell idővel a keresőben és az AI Overview funkció alatt dolgozzon és hatékonyabbá tehesse az internetes keresést, miután már összetettebb kérdések kezelését is hatékonyabban végzi el, beleértve a többlépcsős matematikai problémákat és kódolási feladatokat. A modell szolgáltathat alapot további olyan AI-projekteknek is, mint a Project Astra AI-ügynök, ami több nyelv támogatásával bővül a jövőben.

Bemutatkozott a Google Gemini 2.0

A keresőóriás második generációs multimodális technológiája a szövegek mellett képes szóbeli és vizuális inputok alapján is dolgozni, képet és hanggenerálást is támogat.

USA Tech Hub: ahonnan a passzátszél fúj

USA Tech Hub: ahonnan a passzátszél fúj

Szorul a hurok a TP-Link nyaka körül az USA-ban

Rövid távon nem sok jóra számít az Intel

Bemutatkozott a Google Gemini 2.0

A keresőóriás második generációs multimodális technológiája a szövegek mellett képes szóbeli és vizuális inputok alapján is dolgozni, képet és hanggenerálást is támogat.

USA Tech Hub: ahonnan a passzátszél fúj

USA Tech Hub: ahonnan a passzátszél fúj

Szorul a hurok a TP-Link nyaka körül az USA-ban

Rövid távon nem sok jóra számít az Intel

Minden Amerikába szánt iPhone-t Indiában gyárthatnak

Teljes gőzzel fordul rá az Adobe a generatív AI-ra

A Perplexity is szívesen vinné a Chrome-ot

Minden Amerikába szánt iPhone-t Indiában gyárthatnak

Teljes gőzzel fordul rá az Adobe a generatív AI-ra

A Perplexity is szívesen vinné a Chrome-ot