A Google Gemini az egyik legjelentősebb új szereplő 2024 mesterséges intelligencia piacán. A Google célja, hogy növelje vezető szerepét a különböző iparágakban, és ezt a Gemini segítségével éri el, amely szinte minden Google Workspace alkalmazásban jelen van. Bár az AI technológia izgalmas, komoly etikai kérdéseket vet fel a kreatív szektorban, különösen a szerzői jogok és a tisztességes fizetés kapcsán.
Imagen 3
Az Imagen 3, a Google szövegből képet generáló eszköze, közvetlenül érintett ebben a vitában, de a Google kijelentette, hogy megvédi a felhasználóit, ha AI által generált képek megsértik a szerzői jogokat. A vitától függetlenül a Gemini képalkotási felhasználói élménye folyamatosan fejlődik, és most több testreszabási lehetőséget kínál.
Amíg lehetőség van a képek generálására a Geminivel, a közös pont az Imagen 3 és Imagen 2 között a négyzet alakú vászonkimenet volt. Ez hamarosan változni fog, mivel az Android Authority szerint a Google app 15.41.34.29.arm64 bétaverziójában már van beállítás a Gemini képeinek átméretezésére. Ez nem csak egy egyszerű vágási és méretezési eszköz lesz; a jelentés szerint a Gemini több háttérrészletet ad hozzá a vágott képekhez, és kitölti az üres területeket, ha a képeket nagyítják.
A Gemini mozgalmas éve a képalkotásban
A Gemini képalkotási eszközeivel rengeteg fejlesztés zajlik a háttérben, és az Imagen 3 naponta okosabbá válik. Az Imagen harmadik verziója augusztusban jelent meg, és javította az Imagen 2 által használt utasítások megértését, valamint bevezette a négyképes kimeneti lehetőséget, az Imagen 3 Fast-ot.
Egy hiányosság (vagy, ami társadalmilag pozitívum) az, hogy a Gemini nem képes emberekről képeket generálni. A Google elismerte, hogy a Gemini képalkotási képességei eleinte „nem értek célt”, és bár még mindig nem lehet emberekről képeket generálni, ez társadalmilag elfogadható.
Az Imagen 3 számos Google alkalmazásba beépült, például a Diákba. A felhasználóknak nem kell elhagyniuk a sablonjaikat ahhoz, hogy AI képeket készítsenek a felhőben, de ehhez Enterprise vagy Education fiók szükséges, vagy hozzáférés a Google Workspace Labs-hoz. A személyes fiókok a Google One AI Premium előfizetéssel szerezhetnek hozzáférést ehhez a funkcióhoz. Ezen kívül a Google Pixel 9 Képernyőképek alkalmazása is megkapta végre a Gemini integrációt, amit már régóta vártunk.