Project Genie: Așa funcționează generatorul de lumi al Google DeepMind

Ultima actualizare: 30/01/2026

  • Project Genie vă permite să creați lumi 3D interactive din text sau imagini, cu ajutorul modelului Genie 3 și al altor tehnologii Google AI.
  • Accesul este limitat la abonații Google AI Ultra din SUA, cu sesiuni de 60 de secunde și o rezoluție apropiată de 720p.
  • Lumile sunt dinamice și remixabile, dar suferă de rate de cadre scăzute, unele lag-uri, erori fizice și rezultate inconsistente.
  • Proiectul Genie face parte din cursa pentru modele mondiale și AGI, cu implicații viitoare pentru jocuri video, educație și simulare, inclusiv în Europa.
Proiectul Genie

Google DeepMind a început să deschidă, într-un mod limitat, accesul la Proiectul Genieun prototip de cercetare care permite generați lumi virtuale interactive bazat pe descrieri sau imagini în limbaj natural. Deocamdată, doar abonații la abonament îl pot încerca. Google AI Ultra în Statele Unite, dar compania a sugerat deja că intenția sa este de a-și extinde acoperirea în mai multe teritorii în timp, lucru pe care dezvoltatorii și studiourile europeni îl vor urmări foarte îndeaproape.

Departe de a fi un produs finit, Genie este prezentat ca un laborator viu în care Google dorește să observe cum oamenii le folosesc. modele mondialepentru a colecta date și a măsura în care această tehnologie poate servi drept bază pentru jocuri video, simulări, instruire și noi forme de conținut interactiv. Chiar și cu limitările sale actuale, oferă o privire asupra direcției în care ar putea ajunge tehnologia. IA generativă aplicată mediilor 3D în anii următori.

Ce este Proiectul Genie și ce îl face diferit?

Proiectul Genie

În esență, Proiectul Genie Este o platformă experimentală care preia un text sau o imagine și o transformă într-o scenariu jucabil în câteva secunde. Instrumentul combină mai multe dintre modelele de inteligență artificială ale Google: modelul mondial Genie 3, generatorul de imagini Nano Banană Pro și model multimodal Gemeniilucrând în lanț pentru a trece de la o idee la o lume navigabilă cu un caracter controlabil.

Utilizatorul începe cu o „schiță a lumii” în care descrie în cuvinte cum dorește să fie mediul și ce tip de personaj sau punct de vedere dorește: mers pe jos, zbor, conducere, călărie, vedere la persoana întâi sau a treia etc. Din acel script, Nano Banana Pro generează un imagine de previzualizare a scenei care poate fi ajustat înainte de a face următorul pas: transformarea lui într-un spațiu 3D interactiv cu Genie 3.

Cheia este că modelul nu creează doar un set static, ci simulează dinamica mediului cadru cu cadruFuncționează ca un „motor de predicție” care calculează următorul cadru pe baza acțiunilor jucătorului, mai degrabă decât ca un motor grafic tradițional care redă o scenă predefinită. Acest lucru permite ca regulile lumii jocului să se schimbe din mers, deși în prezent această promisiune este însoțită de o serie de inconsistențe vizuale și fizice.

În această fază inițială, Genie se concentrează mai mult pe explorare creativă decât să ofere o experiență de joc rafinată. Valoarea sa constă în demonstrarea faptului că un utilizator fără cunoștințe de programare poate trece de la o expresie precum „un castel de nori de bezea pe un râu de ciocolată” la o lume jucabilă într-un timp foarte scurt.

CLAWBOT
Articol conex:
Clawdbot, agentul de inteligență artificială care se instalează pe computerul tău și îți controlează aplicațiile de mesagerie

Cum funcționează generarea lumii pas cu pas

Lumile Proiectului Genie

Fluxul de utilizare al Proiectul Genie Este conceput să fie relativ simplu, cel puțin pe hârtie. Totul începe cu un formular scurt în care sistemul întreabă despre lumea pe care vrei să o creezi și ce rol va avea personajul principal. De acolo, inteligența artificială în sine înlănțuie modelele:

  • 1. Schițarea lumiiUtilizatorul descrie mediul („un oraș futurist noaptea”, „o insulă vulcanică plutitoare”, „un ocean cu valuri gigantice și un surfer”) și definește tipul de avatar și modul de explorare.
  • 2. Generarea de imagini: Nano Banană Pro Creează o imagine statică ce reprezintă scenariul respectiv, ce poate fi modificată (culori, compoziție, stil) pentru a rafina rezultatul.
  • 3. Crearea lumii jucabilecu acea imagine ca bază, Duhul 3 Creează un mediu interactiv în care te poți mișca, sări, zbura sau efectua alte acțiuni, camera fiind reglabilă în timpul jocului.
  • 4. Explorare și înregistrareUtilizatorul are sesiuni de până la 60 de secunde să călătorești prin lume. La final, poți descărca un videoclip al călătoriei.
  • 5. Remix și galerieei pot remixează lumi existente, atât ale tale, cât și ale altor utilizatori, sau pornește de la o selecție atent selecționată dintr-o galerie pentru a crea noi variante.
Conținut exclusiv - Faceți clic aici  Cum să selectați mai multe imagini în Google Docs

Pe lângă solicitările textuale, Geniul recunoaște fotografii reale ca punct de plecareDe exemplu, o imagine a unui munte acoperit de zăpadă ar putea fi folosită pentru a genera o hartă la mare altitudine cu un alpinist agil sau o fotografie a unei străzi europene ar putea fi transformată într-un mediu explorabil cu o estetică de joc video. Cu toate acestea, Rezultatele nu mențin întotdeauna acuratețea așteptată. cu imaginea originală.

Experiența actuală este condiționată de mai multe restricții tehniceLumile sunt prezentate într-o rezoluție apropiată de 720p, cu un rată de cadre între 20 și 24 de cadre pe secundă și o întârziere de intrare vizibilăAsta face ca controlul personajului să pară oarecum greoi. Nu este o coincidență: fiecare sesiune rezervă un jeton întreg pentru utilizator și Google a stabilit o limită de timp pentru acordarea accesului simultan mai multor persoane. fără a crește costurile de calcul.

DeepMind insistă că acesta este un prototip și că comportamentul său ar putea fi neregulat; în unele ocazii Unele lumi sunt relativ coerente și ușor de jucat, în timp ce în altele sistemul generează scenarii ciudate.Schimbări bruște ale terenului sau animații nenaturale. Chiar și așa, cercetătorii vorbesc despre „blițuri” ale unui lucru care nu poate fi realizat în niciun alt mod cu tehnologia actuală.

Primele teste: creativitate, lag și clone ale clasicilor

Geniul Proiectului Shiba Inu

Testele efectuate de jurnaliști și creatori de conținut au relevat atât potențial creativ Punctele forte și punctele slabe ale Proiectului Genie au fost evidențiate. În demonstrațiile organizate de Google, lumi fantastice precum Castele de nori făcute din bezele pe râuri de ciocolatăprecum și medii mai realiste cu zăpadă deformabilă sau mări agitate cu valuri mari turcoaz.

La cealaltă extremă, unii reporteri au încercat să împingă sistemul pe un teritoriu mai sensibil, cum ar fi reconstituirea jocuri video emblematiceFolosind descrieri atent elaborate, au fost create lumi care sunt în mod clar inspirate de titluri precum Super Mario 64, Metroid Prime o Legenda Zeldei: Respirația sălbăticiei, cu elemente care amintesc nu doar de stilul vizual, ci și de anumite mecanica joculuiÎn cazul unui scenariu de tip Zelda, personajul a folosit chiar și un fel de parapantă atunci când a sărit, ceea ce Acest lucru sugerează că modelul a învățat tipare foarte specifice din videoclipurile de joc. disponibil pe web.

El Problema este că experiențadincolo de efectul inițial de „uau”, Este încă departe de a fi solidLimita de sesiune de 60 de secunde scurtează jocurile, rata scăzută de cadre pe secundă afectează fluiditatea, iar latența comenzilor face ca controlul personajului să fie frustrant pentru oricine este obișnuit cu un joc comercial.

Conținut exclusiv - Faceți clic aici  Qualcomm își finalizează planul 6G cu teste precomerciale

Apar și fenomene tipice acestui tip de model: cărări care se transformă brusc în iarbăTușe de vopsea care dispar fără niciun motiv aparent sau personaje care trec prin pereți și obiecte solide fără a ține cont de vreo fizică credibilă. Toate acestea întăresc ideea că Genie nu este încă un înlocuitor pentru un motor precum Unity sau Unreal, dar... un experiment la nivel înalt despre cum ar putea funcționa un „motor de inteligență artificială pură”.

Chiar și așa, pentru multe echipe creative, valoarea nu constă atât în ​​a se juca cu aceste lumi ore în șir, cât în ​​a putea... testează ideile aproape instantaneu, să vedem ce fel de mediu generează IA cu o anumită solicitare și, de acolo, să regândim designul unui proiect mai amplu.

Proprietatea intelectuală, securitatea și moderarea conținutului

Posibilitatea de a crea lumi care amintesc de francizele existente a declanșat semnale de alarmă cu privire la proprietate intelectualăÎn testele inițiale, Project Genie a permis crearea, fără obstacole majore, a unor scenarii foarte asemănătoare cu cele din anumite sage celebre, ceea ce a determinat Google să înăsprească restricțiile chiar înainte de publicarea unor articole.

În special, compania a blocat crearea de lumi asociate cu nume protejate, cum ar fi „Mario”, și a implementat filtre care împiedică în mod direct introducerea anumitor termeni sau referințe explicite. În alte cazuri, atunci când utilizatorii descriu doar aspectul fizic al personajelor sau al elementelor unui brand, sistemul generează lumi care evocă acele universuri fără a le menționa pe nume, clarificând faptul că... moderare automată Va fi un teren complex.

DeepMind recunoaște că menține mai multe activități active măsuri de securitate Aceste măsuri sunt concepute pentru a reduce conținutul neadecvat sau conținutul care ar putea încălca drepturile terților. Compania este deja familiarizată cu primirea de avertismente formale - cum ar fi o scrisoare de încetare și renunțare din partea Disney pentru utilizarea anterioară a modelelor generative - și preferă să fie mai precaută în timp ce ajustează comportamentul sistemului.

Combinarea modelelor antrenate pe baza unor cantități vaste de date publice și a accesului, deși limitat, al utilizatorilor finali ridică întrebări care sunt deja abordate în Europa, în special în contextul noului cadru de reglementare privind inteligența artificială. Pe măsură ce Proiectul Genie ajunge în mai multe regiuni, va fi crucial să vedem cum se adaptează la aceste provocări. Cerințe legale europene privind transparența, drepturile de autor și gestionarea conținutului generat.

Pentru dezvoltatorii și companiile din sectorul creativ din Spania și din alte țări ale UE, această fază inițială servește drept câmp de observație: aceștia pot lua notă de modul în care Google abordează moderarea și pot începe să se gândească de acum la modele de afaceri care respectă proprietatea intelectuală, atunci când aceste instrumente devin mai disponibile pe scară largă.

Modele ale lumii și carieră în domeniul AGI

Exemplu de lume generată de Project Genie

Dincolo de utilizarea sa recreațională, Proiectul Genie se încadrează în strategia de Google DeepMind să avanseze în așa-numitul modele mondialeUn model al lumii este o componentă pe care mulți cercetători o consideră esențială pe calea către o inteligență artificială mai generală. Spre deosebire de alte sisteme care generează doar imagini sau videoclipuri izolate, un model al lumii urmărește să... reprezintă intern un mediu și să prezică cum va evolua aceasta pe baza acțiunilor întreprinse în cadrul ei.

DeepMind are o lungă istorie de agenți IA care au stăpânit jocuri specifice precum șahul sau Go, dar aceste medii sunt foarte închise și perfect definite. Provocarea pentru o IA de uz general este de a gestiona contexte variate, cu reguli ambigue și elemente imprevizibile - ceva mult mai apropiat de modul în care funcționează lumea reală.

Conținut exclusiv - Faceți clic aici  Cum să utilizați Lightscribe în Windows 10

Cu Genie 3, Google încearcă să demonstreze că un singur model poate gestiona mai multe tipuri de scenariiDe la peisaje fantastice la simulări mai realiste, generând mișcări, interacțiuni și fizică consistente. Pe hârtie, acest tip de tehnologie poate fi aplicat în robotică, navigație în spații complexe, animație avansată sau explorarea siturilor istorice recreate digital.

Lansarea Proiectului Genie vine și într-un context de concurență tot mai mare În acest domeniu, companii și laboratoare precum World Labs — condusă de Fei-Fei Li cu produsul său Marble —, startup-ul de video generativ Runway și AMI Labs, noul proiect al lui Yann LeCun, își dezvoltă propriile modele de lume. Este foarte probabil ca, în următorii ani, să vedem un ecosistem în care diferiți jucători concurează pentru a oferi cele mai bune simulări, cu implicații directe pentru sectoarele de divertisment și industrie din Europa.

Pentru universitățile, centrele de cercetare și companiile de tehnologie europene, acest scenariu deschide oportunități de colaborare și, de asemenea, de reglementare: este un domeniu în care UE dorește să aibă propria voce, atât din punct de vedere științific, cât și din punct de vedere al reglementării.

Oportunități și provocări pentru dezvoltatori și startup-uri din Europa

Deși accesul oficial la Proiectul Genie În prezent, este limitată la abonații Google AI Ultra din Statele Unite și la persoanele peste 18 ani, iar dezvoltarea sa va fi urmărită îndeaproape de startup-uri în jocuri video, tehnologie educațională sau simulare în Spania și în restul Europei. Motivul este simplu: un instrument capabil să genereze prototipuri jucabile sau scenarii de testare în câteva secunde reprezintă o scurtătură semnificativă în comparație cu procesele tradiționale.

Echipele mici ar putea folosi platforme de acest tip pentru a validarea mecanicii de jocExperimentați cu diferite stiluri vizuale sau construiți demonstrații rapide pentru investitori și parteneri, reducând timpul și costurile asociate cu pre-producția. În sectoare precum trainingul corporativ sau educația, posibilitatea de a crea medii imersive personalizate pentru a explica concepte complexe, a exersa proceduri sau a simula situații riscante fără a fi nevoie de bugete mari.

Totuși, această fereastră de oportunitate vine cu mai multe provocări. În primul rând, Calitatea și stabilitatea lumilor generate sunt încă departe de nivelul necesar. pentru o lansare comercială, așa că orice proiect serios ar trebui să combine aceste modele cu tehnologii mai maturePe de altă parte, dezbaterea despre originea datelor de instruire, drepturile asupra conținutului rezultat și obligațiile legale din UE adaugă un alt nivel de complexitate. o complexitate pe care companiile europene nu o pot ignora.

Privind spre următorii câțiva ani, cel mai sensibil lucru pentru ecosistemul european pare a fi să meargă monitorizarea dezvoltării Project Genie sugerează participarea la programe pilot atunci când acestea se deschid în alte teritorii și explorarea parteneriatelor cu parteneri tehnologici pentru a integra în mod responsabil aceste modele. O poziționare bună atunci când accesul se extinde ar putea face diferența dintre a fi pregătit și a rămâne în urmă.

Pe baza a tot ceea ce s-a văzut până acum, Proiectul Genie se remarcă ca unul dintre cele mai izbitoare experimente la intersecția dintre IA generativă și lumile interactive: un sistem încă în curs de dezvoltare, cu întârzieri, limitări stricte și rezultate imprevizibile, dar care indică o modalitate diferită de a crea și explora medii digitale care, mai devreme sau mai târziu, va ajunge să influențeze modul în care jocurile video, simulările și... experiențe imersive și din Spania și din restul Europei.