- Google AI Studio permet modificar imatges amb instruccions de veu o text.
- Utilitza el model Imatge 3, optimitzat per a velocitat i precisió.
- La plataforma està integrada a Vertex AI i requereix una sol·licitud d'accés.
- Ideal per a creadors de contingut, dissenyadors i empreses de màrqueting.
L'edició de fotos amb la veu és una de les innovacions més sorprenents que ha portat la intel·ligència artificial els darrers anys. I no estem parlant de fer fotos amb ordres de veu, sinó que ara, gràcies als avenços en models generatius, és possible modificar imatges simplement donant instruccions de veu o text, sense necessitat d'eines complexes d'edició.
Google AI Studio, en combinació amb la plataforma Vertex AI, permet aplicar aquests canvis de manera ràpida i precisa. A través d'ordres detallades, l'usuari pot ajustar diferents aspectes de la imatge, com ara colors, il·luminació o fins i tot afegir o eliminar elements. A continuació, expliquem detalladament com funciona aquesta tecnologia i com la pots aprofitar.
Què és Google AI Studio i com funciona?

Google AI Studio és una plataforma d'intel·ligència artificial que facilita la creació i la manipulació de contingut visual mitjançant models de generació d'imatges. Utilitza models avançats com Imagen 3, que ha millorat notablement en termes de velocitat i comprensió d'instruccions en comparació de les seves versions anteriors.
Un dels grans avantatges daquesta eina és que no requereix coneixements avançats de disseny, ja que només cal ingressar una ordre de veu o escriure una instrucció en text per aplicar modificacions a la imatge. Això és especialment útil per creadors de contingut, dissenyadors sense experiència en edició i qualsevol persona interessada a millorar imatges de manera senzilla.
Característiques principals de ledició de fotos amb la veu
La intel·ligència artificial de Google permet fer edicions de manera intuïtiva i ràpida. Algunes de les característiques més destacades són:
- Edició sense màscara: No cal seleccionar manualment les àrees a modificar. El sistema entén les instruccions i ajusta la imatge automàticament.
- Generación rápida de imágenes: Imatge 3 és un model optimitzat que permet resultats fins a un 40% més ràpids que la versió anterior.
- Compatibilidad con múltiples idiomas: Les ordres es poden donar en diferents idiomes, cosa que en facilita l'ús en una audiència global.
- Seguridad y autenticidad: Incorpora la marca d'aigua digital SynthID de Google DeepMind per garantir l'autenticitat de les imatges generades.
Per tant, per utilitzar aquesta funció, cal accedir a Vertex AI a Google Cloud. Actualment, l'opció de personalització i edició d'imatges està disponible per a usuaris aprovats, cosa que significa que heu de sol·licitar accés a través del formulari corresponent. Potser t'interessa saber sobre la personalització de la veu de Google Assistant.
Un cop dins de la plataforma, pots carregar una imatge i començar a modificar-la mitjançant instruccions de text o veu. Per exemple, pots dir “Afegir un fons de naturalesa” o “Augmentar la lluminositat”, i la IA aplicarà els canvis automàticament.
Per a qui és útil aquesta tecnologia?

Aquesta eina és especialment útil per a:
- Creadores de contenido: Permet generar imatges cridaneres sense necessitat de coneixements avançats en edició.
- Diseñadores gráficos: Facilita la creació de prototips i iteracions ràpides en projectes visuals.
- Empreses de màrqueting digital: Ajuda a generar imatges impactants per a campanyes publicitàries sense dependre d'editors externs.
L'edició de fotos amb la veu a través de Google AI Studio ofereix noves possibilitats creatives i simplifica el procés d'edició d'imatges. La integració amb Vertex AI i el model Imagen 3 garanteixen resultats d'alta qualitat, flexibilitat en la personalització i rapidesa en els canvis. Si voleu provar aquesta tecnologia, podeu sol·licitar accés a través de la plataforma de Google Cloud.
Sóc un apassionat de la tecnologia que ha convertit els seus interessos frikis en professió. Porto més de 10 anys de la meva vida utilitzant tecnologia d'avantguarda i traslladant tota mena de programes per pura curiositat. Ara he especialitzat en tecnologia d'ordinador i videojocs. Això és perquè des de fa més de 5 anys que treballo redactant per a diverses webs en matèria de tecnologia i videojocs, creant articles que busquen donar-te la informació que necessites amb un llenguatge comprensible per tothom.
Si tens qualsevol pregunta, els meus coneixements van des de tot allò relacionat amb el sistema operatiu Windows així com Android per a mòbils. I és que el meu compromís és amb tu, sempre estic disposat a dedicar-te uns minuts i ajudar-te a resoldre qualsevol dubte que tinguis a aquest món d'internet.