Modelul AI Gemini de la Google este din nou capabil să genereze imagini cu oameni după ce a „întrerupt” această funcționalitate în februarie, în urma protestelor împotriva reprezentărilor rasiste inexacte din punct de vedere istoric în mai multe rezultate. BlogGoogle a declarat că modelul său Imagen 3 – care a fost anunțat pentru prima dată în mai – va „începe să difuzeze o generație de imagini de oameni” pentru utilizatorii Gemini Advanced, Business și Enterprise în „zilele următoare”. Dar recent a fost pusă la dispoziția publicului o versiune a acestui model Imagen – completă cu capacități de generare de imagini umane Prin mediul de testare Gemini Labs Fără abonament plătit (deși pentru a vă conecta este necesar un cont Google).
Acest nou model vine cu câteva garanții pentru a încerca să evite crearea de imagini controversate, desigur. Google scrie în anunțul său că nu sprijină „crearea de imagini realiste ale unor persoane identificabile, reprezentări ale minorilor sau scene excesiv de sângeroase, violente sau sexuale”. Întrebări frecventeGoogle explică că interzicerea „persoanelor identificabile” include „anumite interogări care pot da rezultate pentru persoane de seamă”. În testul Ars, aceasta înseamnă că o interogare precum „Președintele Biden joacă baschet” ar fi respinsă, în timp ce o solicitare mai generală precum „Președintele Statelor Unite joacă baschet” ar genera mai multe opțiuni.
În unele teste rapide ale noului sistem Imagen 3, Ars a constatat că a evitat multe dintre erorile rasiale răspândite „inexacte din punct de vedere istoric” care au determinat Google să nu mai genereze imagini cu oameni Gemeni, în primul rând. De exemplu, când Imagen 3 solicită o „reprezentare exactă din punct de vedere istoric a unui monarh britanic”, acum produce un grup de bărbați albi cu barbă în robe roșii, mai degrabă decât amestecul divers etnic de războinici din modelul Gemeni înainte de a se opri. Mai multe exemple înainte și după ale vechiului Gemeni și noului Imagine 3 puteți găsi în galeria de mai jos.
Dar unele încercări de a descrie scene istorice generice par să intre în conflict cu regulile AI ale Google. O solicitare de imagini cu „soldatul german din 1943” – la care Gemenii i-a răspuns anterior cu oameni asiatici și de culoare purtând uniforme naziste – le cere acum utilizatorilor să „încerce un alt prompt și să verifice politicile noastre de conținut”. Solicitările de imagini cu „filozofi chinezi antici”, „liderul cu drept de vot al femeilor ținând un discurs” și „un grup de protestatari pașnici” au dus, de asemenea, la același mesaj de eroare în testul Ars.
„Desigur, ca și în cazul oricărui instrument AI generativ, nu fiecare imagine creată de Gemeni va fi perfectă, dar vom continua să ascultăm feedback-ul primilor adoptatori pe măsură ce continuăm să ne îmbunătățim”, a scris compania pe blogul său. „Vom lansa treptat acest program, cu scopul de a-l aduce în curând la mai mulți utilizatori și limbi.”
Imagine de listare de Google/Ars Technica
„Iubitor tipic de twitter. Muzicholic pe tot parcursul vieții. Fanatic al culturii pop. Prieten al animalelor de pretutindeni. Evanghelist avid de bere. Jucător certificat.”