A Google új MI-je nemcsak kijavítja a matekházit, de azt is megmutatja, hogy a gyerek hol rontotta el
2023. december 7. – 13:18
Miközben a politikusok próbálnak lépést tartani a mesterséges intelligenciával – többnyire sikertelenül –, az Amazon csetbotja üzleti titkokat kotyog ki és az egyik legjelentősebb cégnél, az OpenAI-nál épp kikászálódtak a káoszból, a Google tovább dolgozott a saját MI-modelljén, amit a titkos fejlesztés hónapjai után tegnap hivatalosan be is jelentettek.
Ez a Gemini, a cég legjobb nagy nyelvi modellje (large language model – LLM). Már ez hajtja a techóriás csetbotját, a Bardot, és a Nano verziója bekerült a Pixel 8 Pro telefonokba.
A bejelentő közleményben Sundar Pichai, a Google és az Alphabet vezérigazgatója azt írta, hogy a fejlesztés közben igyekeznek megtartani az egyensúlyt a minél gyorsabb fejlődés és a biztonságos haladás között. Épp ezért olyan eszközöket is felhasználnak, amikkel csökkenthetik az MI jelentette kockázatokat, és állami szereplőkkel is együtt dolgoznak, pont ugyanezért.
A bejelentésben sokszor elhangzik, hogy a Gemini multimodális, ami azt jelenti, hogy a modell egyszerre többfajta beérkező jelet is tud értelmezni, legyen szó szövegről, kódról, képekről, hangokról vagy videókról. Hogy ez a legtöbb ember számára mikor lesz hasznos? A Google a tökéletes példát hozta erre a demóvideóban.
Képzelje el, hogy épp a vacsora után mosogat. Már látja maga előtt, hogy mindjárt le tud ülni egy kicsit olvasni vagy tévézni, amikor papucscsoszogásra lesz figyelmes. Jön a tizedikes gyereke, hogy segítsen a matekháziban, mert ő nem érti. Na most, ön nem mondhatja, hogy 20 éve látott utoljára gyökjelet, és különben is, már akkor sem értette, hogy x egyenlő mínuszbé pluszminusz gyökalatt bénégyzet mínusz négyácé per kétá.
Itt jön a képbe a Gemini. A Google szerint az MI könnyen értelmezi a tudományos feladatokat, és felismeri a kézzel írt megoldási kísérleteket is. Ez azt jelenti, hogy nem csak a megoldást tudja, de azt is elárulja, hogy a gyerek hol hibázott. Ha nem tiszta, hogy miért is nem jó, amit írt, akkor további kérdésekkel mélyebbre lehet ásni. Persze egyelőre csak angolul.
Még a szakembereket is lekörözi
Tegyük fel, hogy érti a matekot. Ez mindössze egy dolgot jelenthet: vagy szoftverfejlesztő, vagy tudós. A Gemini még így is hasznosnak bizonyulhat. A Google szerint a Gemini képes megérteni és elmagyarázni jó minőségű, a legnépszerűbb programozási nyelvekben írt kódokat, sőt, még generálni is tud ilyet.
A modell jól szerepel az iparban használt HumanEval benchmarkjain, valamint a Google saját adathalmazával dolgozó Natural2Code-dal is. Két évvel ezelőtt már kialakítottak egy AlphaCode nevű, MI-s kódgeneráló rendszert, ami programozási versenyeken jobban szerepelt, mint a résztvevők 50 százaléka. A Geminit felhasználva összerakták az AlphaCode 2-t, ami már a résztvevők 85 százalékánál hatékonyabb.
A Google a kutatókra is gondolt: azt állítják, hogy a Gemini a kifinomult érvelési rendszerével emberi szempontból tud villámgyorsan átnézni nagyon sok tudományos cikket, hogy kiválogassa azokat, amikre a felhasználónak szüksége van. A prezentáció szerint amíg a google-ösök kimentek ebédelni, a Gemini átnézett 200 ezer cikket, és kiválogatott ebből 250-et, ami a megadott paraméterek alapján relevánsnak tűnt, és egy táblázatba rendezte azokat. Az új adatok alapján még egy régebbi grafikont is pillanatok alatt frissített. Arról nem esett szó, hogy hány absztraktot értelmezett rosszul vagy hány releváns tanulmányt hagyott ki.
A közlemény szerint a Gemini három verzióban érkezik majd: Nano, amit az okoseszközökre fejlesztenek, Pro, ami már most a Bardot hajtja, valamint a később érkező Ultra, a legfejlettebb verzió, ami jövőre kerül majd ki a nagyvilágba.
Az Ultrát rászabadították több, akadémiai és ipari szinten használt benchmarkra, és 32-ből 30-nál megverte a jelenleg legkorszerűbb konkurens LLM-eket. Az MMLU-teszten, amin 57 tárgy kombinációjából állnak a kérdések (például matek, fizika, történelem, jog, etika), 90 százalékot ért el, így a Gemini Ultra az első LLM, ami lekörözte az emberi szakértőket.
A Transtelex egy egyedülálló kísérlet
Az oldal mögött nem állnak milliárdos tulajdonosok, politikai szereplők, fenntartói maguk az olvasók. Csak így lehet Erdélyben cenzúra nélkül, szabadon és félelmek nélkül újságot írni. Kérjük, legyél te is a támogatónk!
Támogató leszek!