- ഇമേജുകൾ സൃഷ്ടിക്കുന്നതിനും എഡിറ്റ് ചെയ്യുന്നതിനുമുള്ള ഗൂഗിളിന്റെ പുതിയ മോഡലായ ജെമിനി 2.5 ഫ്ലാഷ് ഇമേജിന്റെ കോഡ്നാമമാണ് "നാനോ ബനാന".
- ഇത് സംഭാഷണ എഡിറ്റിംഗ് അനുവദിക്കുന്നു, ആളുകളും വസ്തുക്കളും തമ്മിലുള്ള സ്ഥിരത നിലനിർത്തുന്നു, കൂടാതെ ചിത്രങ്ങളെ സ്വാഭാവിക ഭാഷാ നിർദ്ദേശങ്ങളുമായി സംയോജിപ്പിക്കുന്നു.
- ഒരു അദൃശ്യ വാട്ടർമാർക്കായി SynthID ഉൾപ്പെടുന്നു, സെൻസിറ്റീവ് ഉള്ളടക്കത്തിനും പൊതു വ്യക്തികൾക്കും വേണ്ടിയുള്ള ഫിൽട്ടറുകൾ.
- ജെമിനി-2.5-ഫ്ലാഷ്-ഇമേജ്-പ്രിവ്യൂ മോഡൽ ഉപയോഗിച്ച് നിങ്ങൾക്ക് ജെമിനി ആപ്പിലും ഗൂഗിൾ എഐ സ്റ്റുഡിയോയിലും ഇത് പരീക്ഷിക്കാവുന്നതാണ്.

ആഴ്ചകൾ നീണ്ട അഭ്യൂഹങ്ങൾക്ക് ശേഷം, വിളിപ്പേര് "നാനോ ബനാന" ഒരു രഹസ്യമാകുന്നത് നിർത്തുന്നു: യോജിക്കുന്നു ഗൂഗിളിന്റെ പുതിയ ഇമേജ് എഞ്ചിൻ, ഔദ്യോഗികമായി അനാച്ഛാദനം ചെയ്തത് ഇങ്ങനെയാണ് ജെമിനി 2.5 ഫ്ലാഷ് ഇമേജ്സൃഷ്ടിപരമായ ഒഴുക്കിലെ സംഘർഷം കുറയ്ക്കാൻ ശ്രമിക്കുന്ന സംഭാഷണ സമീപനത്തോടൊപ്പം ജനറേഷനും എഡിറ്റിംഗും സംയോജിപ്പിക്കുന്ന ഒരു സവിശേഷത കമ്പനി സജീവമാക്കുന്നു.
മിഡ്ജോർണി പോലുള്ള ജനറേറ്ററുകളുമായും ഫോട്ടോഷോപ്പ് പോലുള്ള പരമ്പരാഗത എഡിറ്റർമാരുമായും മത്സരിക്കുന്നതിനാണ് ഈ മോഡൽ എത്തുന്നത്, മെച്ചപ്പെടുത്തലുകൾ ശക്തിപ്പെടുത്തി ഷോട്ടുകൾക്കിടയിലുള്ള സ്ഥിരത, ഫീച്ചർ സംരക്ഷണം, "മിന്നൽ വേഗത്തിൽ" എന്ന് Google വിശേഷിപ്പിക്കുന്ന പ്രതികരണ വേഗത. കൂടാതെ, ഇത് ജെമിനി ആപ്പുമായി സംയോജിപ്പിച്ചിരിക്കുന്നു, കൂടാതെ API-കൾ വഴിയും Google AI സ്റ്റുഡിയോയിലും ലഭ്യമാണ്..
"നാനോ ബനാന" എന്താണ്, അത് എന്താണ് നൽകുന്നത്?

"നാനോ ബനാന" എന്നത് മോഡലിന്റെ ആന്തരിക പേരാണ്, ടെക്സ്റ്റ്-ഗൈഡഡ് എഡിറ്റിംഗിലും ഉയർന്ന നിയന്ത്രിത ജനറേഷനിലും ശ്രദ്ധ കേന്ദ്രീകരിച്ച ഒരു പരിണാമമാണിത്. സിസ്റ്റം സ്വാഭാവിക നിർദ്ദേശങ്ങൾ മനസ്സിലാക്കുകയും ഒരേ ഇമേജിൽ മാറ്റങ്ങൾ പ്രയോഗിക്കുകയും ചെയ്യുന്നു, ഓരോ തവണയും സ്ക്രാച്ചിൽ നിന്ന് ആരംഭിക്കാൻ നിങ്ങളെ നിർബന്ധിക്കാതെ.
അതിന്റെ താക്കോലുകളിൽ ഒന്നാണ് വിഷ്വൽ സ്ഥിരത: നിങ്ങൾ ഒരു ഫോട്ടോ എഡിറ്റ് ചെയ്യുമ്പോൾ, വിഷയത്തിന്റെ മുഖം, പോസ് അല്ലെങ്കിൽ ലൈറ്റിംഗ് പതിപ്പുകൾക്കിടയിൽ സ്ഥിരമായി തുടരും. ഇത് വികലതകൾ അല്ലെങ്കിൽ കാഴ്ചപ്പാടിലെ ചാട്ടങ്ങൾ കുറയ്ക്കുന്നു സങ്കീർണ്ണമായ സാഹചര്യങ്ങളിൽ മറ്റ് എഞ്ചിനുകളിൽ ഇപ്പോഴും ഇവ ദൃശ്യമാകുന്നു.
El കൂടുതൽ വിശ്വസനീയമായ ടെക്സ്ചറുകളും ലൈറ്റിംഗും ഉപയോഗിച്ച് ഫോട്ടോറിയലിസം ഒരു പടി മുന്നോട്ട് പോകുന്നു., ഇമേജ് AI-യിലെ പരമ്പരാഗതമായി സെൻസിറ്റീവ് ആയ രണ്ട് മേഖലകളായ മുഖങ്ങളിലും കൈകളിലും മൂർത്തമായ പുരോഗതി ഉണ്ടെന്ന് Google അവകാശപ്പെടുന്നു. മോഡലും അതിന്റെ വേഗതയിൽ വേറിട്ടുനിൽക്കുന്നു, ഇത് ചെറിയ പരിശോധനയ്ക്കും മെച്ചപ്പെടുത്തൽ ചക്രങ്ങൾക്കും സൗകര്യമൊരുക്കുന്നു.
എൽഎം അരീന പോലുള്ള കമ്മ്യൂണിറ്റി ബെഞ്ച്മാർക്കിംഗിൽ, "നാനോ ബനാന" ഇനിപ്പറയുന്നവയിൽ ഉൾപ്പെടുന്നു: മികച്ച റേറ്റുചെയ്തത് ഉപയോക്തൃ അനുഭവ എഡിറ്റിംഗിൽ, ഗുണനിലവാരം, നിയന്ത്രണം, പ്രതികരണ വേഗത എന്നിവയുടെ സന്തുലിതാവസ്ഥയാൽ നയിക്കപ്പെടുന്നു.
പ്രധാന എഡിറ്റിംഗും ജനറേഷൻ സവിശേഷതകളും
- സംഭാഷണ എഡിറ്റിംഗ്: ചിത്രവുമായുള്ള സംഭാഷണങ്ങൾ, ആവർത്തിച്ചുള്ള ക്രമീകരണങ്ങൾ അഭ്യർത്ഥിക്കുന്നു (ഉദാ. ആകാശത്തെ തീവ്രമാക്കുക, കാറിന്റെ നിറം മാറ്റുക, അല്ലെങ്കിൽ ഒരു വസ്തു ചേർക്കുക).
- പ്രാദേശിക തിരഞ്ഞെടുപ്പും മിനുക്കുപണികളും: ഘടകങ്ങൾ മായ്ക്കുന്നതിനോ, പശ്ചാത്തലം പരിഷ്ക്കരിക്കുന്നതിനോ, ബാക്കിയുള്ളവയെ ബാധിക്കാതെ ലൈറ്റിംഗും നിറവും ക്രമീകരിക്കുന്നതിനോ പ്രത്യേക മേഖലകൾ തിരഞ്ഞെടുക്കുക.
- ഘടനയും മിശ്രിതവും: ഒന്നിലധികം ഫോട്ടോകൾ ഒരൊറ്റ സീനിലേക്ക് സംയോജിപ്പിക്കുകയും ഒരു ചിത്രത്തിന്റെ ശൈലി മറ്റൊന്നിലെ വസ്തുക്കളിൽ പ്രയോഗിക്കുകയും ചെയ്യുന്നു.
- സ്വഭാവ പൊരുത്തം: ഒന്നിലധികം എഡിറ്റുകളിലുടനീളം ഒരേ വ്യക്തിയുടെയോ വളർത്തുമൃഗത്തിന്റെയോ വസ്തുവിന്റെയോ പതിപ്പുകൾ തമ്മിലുള്ള സമാനത നിലനിർത്തുന്നു.
സൃഷ്ടിപരമായ വഴക്കത്തിന് പുറമേ, Google ഒരു സുരക്ഷാ പാളി കൂടി ചേർക്കുന്നു: ജനറേറ്റ് ചെയ്തതോ എഡിറ്റ് ചെയ്തതോ ആയ എല്ലാ ചിത്രങ്ങളിലും SynthID ഉൾപ്പെടുന്നു., പരിവർത്തനത്തെ പ്രതിരോധിക്കുന്ന ഒരു അദൃശ്യമായ ഉൾച്ചേർത്ത വാട്ടർമാർക്ക്, ഉള്ളടക്കം AI സൃഷ്ടിച്ചതാണോ അതോ മാറ്റം വരുത്തിയതാണോ എന്ന് പരിശോധിക്കാൻ നിങ്ങളെ അനുവദിക്കുന്നു.
സിസ്റ്റത്തിൽ ജനറേഷൻ അല്ലെങ്കിൽ കൃത്രിമത്വം തടയുന്നതിനുള്ള ഫിൽട്ടറുകൾ ഉൾപ്പെടുന്നു തന്ത്രപ്രധാന ഉള്ളടക്കം (അക്രമം, വ്യക്തമായ നഗ്നത) എന്നിവ ഒഴിവാക്കുകയും പ്രശസ്തരായ ആളുകളുടെ എഡിറ്റിംഗ് തടയുകയും ചെയ്യുന്നു. ഉപയോക്താവ് മാറ്റം വരുത്തുന്നതിനായി ഒരു യഥാർത്ഥ ഫോട്ടോ അപ്ലോഡ് ചെയ്യുകയാണെങ്കിൽ, ഡീപ്ഫേക്കുകളിലേക്ക് നയിച്ചേക്കാവുന്ന അഭ്യർത്ഥനകൾ തടയാൻ സുരക്ഷാ സംവിധാനങ്ങൾ ശ്രമിക്കുന്നു.
പ്രായോഗികമായി, ഇതിനർത്ഥം സാങ്കേതിക പരിശോധനയിൽ സമയം പാഴാക്കുന്നത് കുറയ്ക്കുകയും സൃഷ്ടിപരമായ ഫലത്തിൽ കൂടുതൽ ശ്രദ്ധ കേന്ദ്രീകരിക്കുകയും ചെയ്യുന്നു എന്നാണ്: സ്വാഭാവിക ഭാഷാ കമാൻഡുകൾ രംഗത്തെ പ്രവർത്തനങ്ങളായി മാറുന്നു. കൂടുതൽ സെമാന്റിക് കൃത്യതയോടെയും സ്കെയിൽ, ആഴം, ശൈലി എന്നിവയോടുള്ള ബഹുമാനത്തോടെയും.
ജെമിനി ആപ്പിലും AI സ്റ്റുഡിയോയിലും നാനോ ബനാന എങ്ങനെ ഉപയോഗിക്കാം

അനുഭവം ജെമിനി ഇന്റർഫേസിലേക്ക് സംയോജിപ്പിച്ചിരിക്കുന്നു, അധിക സോഫ്റ്റ്വെയറിന്റെ ആവശ്യമില്ലാതെ തന്നെ. പല കേസുകളിലും നിങ്ങൾക്ക് ഇത് പ്രയോജനപ്പെടുത്താം, സ്വതന്ത്ര പതിപ്പ്, നിങ്ങളുടെ പ്രദേശത്തെയും അക്കൗണ്ടിലെയും വിന്യാസത്തെ ആശ്രയിച്ച്.
- ജെമിനി ആപ്പിലോ വെബ്സൈറ്റിലോ: സ്വീകരിക്കുക ജെമിനി.ഗൂഗിൾ.കോം/ആപ്പ് (o മൊബൈൽ ആപ്പ്), ലഭ്യമായ ടെംപ്ലേറ്റ് തിരഞ്ഞെടുത്ത് “ടൂളുകൾ” എന്നതിന് കീഴിലുള്ള “ഇമേജുകൾ സൃഷ്ടിക്കുക” എന്നതിലേക്ക് പോകുക.
- സൃഷ്ടിക്കുക അല്ലെങ്കിൽ എഡിറ്റ് ചെയ്യുക: ആദ്യം മുതൽ സൃഷ്ടിക്കാൻ ഒരു പ്രോംപ്റ്റ് ടൈപ്പ് ചെയ്യുക അല്ലെങ്കിൽ എഡിറ്റ് ചെയ്യാൻ ഒരു ഫോട്ടോ അപ്ലോഡ് ചെയ്യുക. ഒന്നിലധികം റൗണ്ടുകളിലൂടെ ഫലം ഫൈൻ-ട്യൂൺ ചെയ്യുന്നതിന് നിങ്ങൾക്ക് ചെയിൻഡ് നിർദ്ദേശങ്ങൾ ചേർക്കാൻ കഴിയും.
- ഉപയോഗപ്രദമായ ഓർഡറുകൾ: “ഷോട്ട് കറുപ്പും വെളുപ്പും ആക്കുക”, “പശ്ചാത്തലത്തിൽ നിന്ന് വസ്തു നീക്കം ചെയ്യുക”, “പശ്ചാത്തലം ഒരു നഗരദൃശ്യമാക്കി മാറ്റുക” അല്ലെങ്കിൽ “ഈ ചിത്രത്തിന്റെ ശൈലി ഈ വസ്ത്രത്തിൽ പ്രയോഗിക്കുക”.
ഡെവലപ്പർ പരിതസ്ഥിതിയിൽ നിന്ന് ശരിയായ മോഡലാണ് ഉപയോഗിക്കുന്നതെന്ന് സാധൂകരിക്കാൻ നിങ്ങൾ ആഗ്രഹിക്കുന്നുവെങ്കിൽ, നിയന്ത്രിത പരിശോധനയ്ക്കായി Google AI സ്റ്റുഡിയോ ഒരു നേരിട്ടുള്ള ഒഴുക്ക് വാഗ്ദാനം ചെയ്യുന്നു. ജെമിനി-2.5-ഫ്ലാഷ്-ഇമേജ്-പ്രിവ്യൂ.
- Google AI സ്റ്റുഡിയോയിലേക്ക് സൈൻ ഇൻ ചെയ്യുക.
- "gemini-2.5-flash-image-preview" മോഡൽ തിരഞ്ഞെടുക്കുക. സെലക്ടറിൽ.
- എഡിറ്റുകൾ തത്സമയം കാണുന്നതിന് ടെക്സ്റ്റ് പ്രോംപ്റ്റുകൾ നൽകുക കൂടാതെ/അല്ലെങ്കിൽ ചിത്രങ്ങൾ അപ്ലോഡ് ചെയ്യുക., മൾട്ടി-ഷിഫ്റ്റ് എഡിറ്റിംഗിനുള്ള പിന്തുണയോടെ.
പെരുമാറ്റം സ്ഥിരതയിലും ഫോട്ടോറിയലിസത്തിലും മെച്ചപ്പെട്ടിട്ടുണ്ടെങ്കിലും, അത് ഓർമ്മിക്കേണ്ടതാണ് ചിത്രങ്ങളിലെ വാചകത്തിന്റെ പ്രാതിനിധ്യം അല്ലെങ്കിൽ ചില സങ്കീർണ്ണമായ പ്രതിഫലനങ്ങൾ ഇതുവരെ പൂർണതയുള്ളതായിരിക്കില്ല.എന്നിരുന്നാലും, ഭാഷാധിഷ്ഠിത എഡിറ്റിംഗും വാട്ടർമാർക്കിംഗും സൃഷ്ടിപരമായ നിയന്ത്രണത്തിനും ഉത്തരവാദിത്തത്തിനും ഇടയിൽ രസകരമായ ഒരു സന്തുലിതാവസ്ഥ നൽകുന്നു.
സംഭാഷണ എഡിറ്റിംഗ്, കഥാപാത്ര സ്ഥിരത, വേഗത, SynthID പോലുള്ള സുരക്ഷാ സംവിധാനങ്ങൾ എന്നിവയുടെ സംയോജനത്തോടെ, മുഖംമൂടികളും ലെയറുകളും കൊണ്ട് സങ്കീർണ്ണമാക്കാതെ ഫോട്ടോകൾ ക്രമീകരിക്കാനോ രംഗങ്ങൾ രചിക്കാനോ ആഗ്രഹിക്കുന്ന സ്രഷ്ടാക്കൾക്കും ബ്രാൻഡുകൾക്കും ഉപയോക്താക്കൾക്കും "നാനോ ബനാന" ഒരു വൈവിധ്യമാർന്ന ഓപ്ഷനായി യോജിക്കുന്നു.: എല്ലാം ജെമിനിയിൽ നിന്ന് തന്നെ, യഥാർത്ഥ ആശയത്തിന് ഏറ്റവും അനുയോജ്യമായ പതിപ്പ് കണ്ടെത്തുന്നത് വരെ ആവർത്തനത്തെ പ്രോത്സാഹിപ്പിക്കുന്ന ഒരു ഒഴുക്കോടെ.
അവൻ്റെ "ഗീക്ക്" താൽപ്പര്യങ്ങൾ ഒരു തൊഴിലാക്കി മാറ്റിയ ഒരു സാങ്കേതിക തത്പരനാണ് ഞാൻ. എൻ്റെ ജീവിതത്തിൻ്റെ 10 വർഷത്തിലേറെ ഞാൻ അത്യാധുനിക സാങ്കേതികവിദ്യ ഉപയോഗിച്ചും ശുദ്ധമായ ജിജ്ഞാസയിൽ നിന്ന് എല്ലാത്തരം പ്രോഗ്രാമുകളും ഉപയോഗിച്ച് ചെലവഴിച്ചു. ഇപ്പോൾ ഞാൻ കമ്പ്യൂട്ടർ സാങ്കേതികവിദ്യയിലും വീഡിയോ ഗെയിമുകളിലും സ്പെഷ്യലൈസ് ചെയ്തിട്ടുണ്ട്. കാരണം, 5 വർഷത്തിലേറെയായി ഞാൻ സാങ്കേതികവിദ്യയിലും വീഡിയോ ഗെയിമുകളിലും വിവിധ വെബ്സൈറ്റുകൾക്കായി എഴുതുന്നു, എല്ലാവർക്കും മനസ്സിലാകുന്ന ഭാഷയിൽ നിങ്ങൾക്കാവശ്യമായ വിവരങ്ങൾ നൽകാൻ ശ്രമിക്കുന്ന ലേഖനങ്ങൾ സൃഷ്ടിക്കുന്നു.
നിങ്ങൾക്ക് എന്തെങ്കിലും ചോദ്യങ്ങളുണ്ടെങ്കിൽ, എൻ്റെ അറിവ് വിൻഡോസ് ഓപ്പറേറ്റിംഗ് സിസ്റ്റവുമായി ബന്ധപ്പെട്ട എല്ലാത്തിലും മൊബൈൽ ഫോണുകൾക്കായുള്ള ആൻഡ്രോയിഡുമായി ബന്ധപ്പെട്ടിരിക്കുന്നു. എൻ്റെ പ്രതിബദ്ധത നിങ്ങളോടാണ്, ഈ ഇൻ്റർനെറ്റ് ലോകത്ത് നിങ്ങൾക്കുണ്ടായേക്കാവുന്ന ഏത് ചോദ്യങ്ങളും പരിഹരിക്കാൻ കുറച്ച് മിനിറ്റ് ചെലവഴിക്കാനും നിങ്ങളെ സഹായിക്കാനും ഞാൻ എപ്പോഴും തയ്യാറാണ്.
