ඔවුන් Gemini හි ඡායාරූපයකට ඇණවුම් රිංගා ගැනීමට ක්‍රමයක් සොයාගෙන ඇත: සරල පරිමාණය මඟින් AI ඒවා ක්‍රියාත්මක කිරීමට සලස්වයි.

අවසන් යාවත්කාලීන කිරීම: 03/09/2025

  • ප්‍රහාරයක් මඟින් රූපවල නොපෙනෙන බහුමාධ්‍ය ප්‍රේරක සඟවයි, ඒවා Gemini මත පරිමාණය කළ විට, අනතුරු ඇඟවීමකින් තොරව ක්‍රියාත්මක වේ.
  • දෛශිකය රූප පෙර සැකසුම් (224x224/512x512) භාවිතා කරන අතර දත්ත පෙරීමට Zapier වැනි මෙවලම් ක්‍රියාරම්භ කරයි.
  • ළඟම අසල්වැසි, ද්විරේඛීය සහ ද්විකුබික් ඇල්ගොරිතම අවදානමට ලක්විය හැකිය; ඇනමෝර්ෆර් මෙවලම ඒවා එන්නත් කිරීමට ඉඩ සලසයි.
  • සංවේදී ක්‍රියා සිදු කිරීමට පෙර පරිමාණය අඩු කිරීම, ආදානය පෙරදසුන් කිරීම සහ තහවුරු කිරීම අවශ්‍ය කිරීම වැළැක්වීමට විශේෂඥයින් උපදෙස් දෙයි.

AI පද්ධති මත රූප ප්‍රහාර

පර්යේෂකයන් කණ්ඩායමක් විසින් රූපවලට සැඟවුණු උපදෙස් එන්නත් කිරීමෙන් පුද්ගලික දත්ත සොරකම් කිරීමඑම ගොනු Gemini වැනි බහුමාධ්‍ය පද්ධති වෙත උඩුගත කරන විට, ස්වයංක්‍රීය පෙර සැකසුම් මඟින් විධාන සක්‍රිය කරන අතර, AI ඒවා වලංගු ලෙස අනුගමනය කරයි.

The Trail of Bits විසින් වාර්තා කරන ලද මෙම සොයාගැනීම නිෂ්පාදන පරිසරයන්ට බලපායි. Gemini CLI, Vertex AI Studio, Gemini API, Google Assistant හෝ Genspark වැනිසැබෑ ලෝක පරිසරවල සූරාකෑම පිළිබඳ කිසිදු සාක්ෂියක් මෙතෙක් නොමැති බැවින්, මෙය කර්මාන්තයට සැලකිය යුතු අභියෝගයක් බව ගූගල් පිළිගෙන ඇත. මොසිල්ලා හි 0Din වැඩසටහන හරහා අවදානම පුද්ගලිකව වාර්තා කරන ලදී.

රූප පරිමාණ ප්‍රහාරය ක්‍රියාත්මක වන ආකාරය

මිථුන රූප පරිමාණ ප්‍රහාරය ක්‍රියා කරන ආකාරය

යතුර පූර්ව විශ්ලේෂණ පියවරේ ඇත: බොහෝ AI නල මාර්ග සම්මත විභේදන වලට රූප ස්වයංක්‍රීයව ප්‍රතිප්‍රමාණ කරන්න (224×224 හෝ 512×512)ප්‍රායෝගිකව, ආකෘතියට මුල් ගොනුව නොපෙනේ, ඒ වෙනුවට පරිමාණය කළ අනුවාදයක් පෙනෙන අතර, එහිදී ද්වේෂසහගත අන්තර්ගතය අනාවරණය වේ.

සුවිශේෂී අන්තර්ගතය - මෙහි ක්ලික් කරන්න  Samsung Wallet Google Pay වෙත මාරු කරන්නේ කෙසේද

ප්‍රහාරකයින් ඇතුළු කිරීම නොපෙනෙන ජල සලකුණු මගින් සැඟවුණු බහුමාධ්‍ය ප්‍රේරක, බොහෝ විට ඡායාරූපයේ අඳුරු ප්‍රදේශවල. ඉහළ පරිමාණ ඇල්ගොරිතම ක්‍රියාත්මක වන විට, මෙම රටා මතු වන අතර ආකෘතිය ඒවා නීත්‍යානුකූල උපදෙස් ලෙස අර්ථකථනය කරයි, එය අනවශ්‍ය ක්‍රියාවන්ට හේතු විය හැක.

පාලිත පරීක්ෂණ වලදී, පර්යේෂකයන්ට හැකි විය Google දින දර්ශනයෙන් දත්ත උපුටා ගෙන බාහිර විද්‍යුත් තැපෑලකට යවන්න. පරිශීලක තහවුරු කිරීමකින් තොරව. ඊට අමතරව, මෙම ශිල්පීය ක්‍රම පවුලට සම්බන්ධ වේ වේගවත් එන්නත් ප්‍රහාර දැනටමත් නියෝජිත මෙවලම්වල (ක්ලෝඩ් කේතය හෝ ඕපන්ඒඅයි කෝඩෙක්ස් වැනි) නිරූපණය කර ඇති අතර, හැකියාව ඇත තොරතුරු කාන්දු කරන්න හෝ ස්වයංක්‍රීයකරණ ක්‍රියා අවුලුවන්න අනාරක්ෂිත ප්‍රවාහයන් සූරාකෑම.

බෙදාහැරීමේ දෛශිකය පුළුල් වේ: වෙබ් අඩවියක රූපයක්, WhatsApp හි බෙදාගත් meme එකක් හෝ a තතුබෑම් ව්‍යාපාරය පුළුවන් අන්තර්ගතය සැකසීමට AI වෙතින් ඉල්ලා සිටින විට විමසුම සක්‍රිය කරන්නවිශ්ලේෂණයට පෙර AI නල මාර්ගය පරිමාණය සිදු කරන විට ප්‍රහාරය ක්‍රියාත්මක වන බව අවධාරණය කිරීම වැදගත්ය; එම පියවර හරහා නොගොස් රූපය බැලීම එය අවුලුවන්නේ නැත.

එබැවින්, අවදානම සංකේන්ද්‍රණය වී ඇත්තේ AI හට සම්බන්ධිත මෙවලම් වෙත ප්‍රවේශය ඇති ප්‍රවාහයන් තුළය (උදා., ඊමේල් යවන්න, දින දර්ශන පරීක්ෂා කරන්න හෝ API භාවිතා කරන්න): ආරක්ෂිත ක්‍රම නොමැති නම්, එය පරිශීලක මැදිහත්වීමකින් තොරව ඒවා ක්‍රියාත්මක කරනු ඇත.

අවදානම් සහිත ඇල්ගොරිතම සහ මෙවලම් සම්බන්ධ වේ

AI හි රූප පරිමාණය කිරීමේ අවදානම

ප්‍රහාරය මගින් ඇතැම් ඇල්ගොරිතම භාවිතා කරන ආකාරය ගසාකයි. අධි-විභේදන තොරතුරු අඩු පික්සල වලට සම්පීඩනය කරන්න. ප්‍රමාණය අඩු කිරීමේදී: ආසන්නතම අසල්වැසි අන්තර් ඡේදනය, ද්වි රේඛීය අන්තර් ඡේදනය සහ ද්වි ඝන අන්තර් ඡේදනය. පණිවිඩය ප්‍රතිප්‍රමාණනය කිරීමෙන් නොනැසී පැවතීම සඳහා එකිනෙකට වෙනස් කාවැද්දීමේ තාක්ෂණයක් අවශ්‍ය වේ.

සුවිශේෂී අන්තර්ගතය - මෙහි ක්ලික් කරන්න  Android පද්ධති SafetyCore: එය කුමක්ද සහ එය ඔබගේ දුරකථනයේ ඇත්තේ ඇයි?

මෙම උපදෙස් ඇතුළත් කිරීමට විවෘත මූලාශ්‍ර මෙවලම භාවිතා කර ඇත ඇනමෝෆර්, ඉලක්ක පරිමාණ ඇල්ගොරිතම මත පදනම්ව රූපවලට ප්‍රේරක එන්නත් කිරීමට සහ ඒවා සියුම් රටා තුළ සැඟවීමට නිර්මාණය කර ඇත. AI හි රූප පූර්ව සැකසුම් අවසානයේ ඒවා හෙළි කරයි.

විමසුම හෙළිදරව් වූ පසු, ආකෘතියට හැකිය Zapier වැනි ඒකාබද්ධ කිරීම් සක්‍රිය කරන්න (හෝ IFTTT හා සමාන සේවාවන්) සහ දාම ක්‍රියා: දත්ත රැස් කිරීම, ඊමේල් යැවීම හෝ තෙවන පාර්ශවීය සේවාවන් වෙත සම්බන්ධතා යැවීම, සියල්ල සාමාන්‍ය ප්‍රවාහයක් තුළ පෙනේ.

කෙටියෙන් කිවහොත්, මෙය සැපයුම්කරුවෙකුගේ හුදකලා අසාර්ථකත්වයක් නොව, පරිමාණය කළ රූප හැසිරවීමේ ව්‍යුහාත්මක දුර්වලතාවය පෙළ, දැක්ම සහ මෙවලම් ඒකාබද්ධ කරන බහුමාධ්‍ය නල මාර්ග තුළ.

අවම කිරීමේ පියවර සහ හොඳ පිළිවෙත්

සින්ත්අයිඩී

පර්යේෂකයින් නිර්දේශ කරන්නේ හැකි සෑම විටම පහත් කිරීමෙන් වළකින්න. සහ ඒ වෙනුවට, බර මානයන් සීමා කරන්නපරිමාණය කිරීම අවශ්‍ය වූ විට, ආකෘතිය සැබවින්ම දකින දේ පිළිබඳ පෙරදසුන, CLI මෙවලම් සහ API තුළද, සහ වැනි හඳුනාගැනීමේ මෙවලම් භාවිතා කරන්න ගූගල් සින්ත්අයිඩී.

සැලසුම් මට්ටමින්, වඩාත්ම ශක්තිමත් ආරක්ෂාව වන්නේ ආරක්ෂක රටා සහ ක්‍රමානුකූල පාලනයන් පණිවිඩ එන්නත් කිරීමට එරෙහිව: රූපයක ඇතුළත් කර ඇති කිසිදු අන්තර්ගතයක් ආරම්භ කිරීමට නොහැකි විය යුතුය. පැහැදිලි තහවුරු කිරීමකින් තොරව සංවේදී මෙවලම් වෙත ඇමතුම් පරිශීලක.

සුවිශේෂී අන්තර්ගතය - මෙහි ක්ලික් කරන්න  කුලී වංචාවන් වළක්වා ගන්නේ කෙසේද

මෙහෙයුම් මට්ටමින්, එය විචක්ෂණශීලී ය නොදන්නා සම්භවයක් ඇති රූප මිථුන ලග්නයට උඩුගත කිරීමෙන් වළකින්න. සහ සහායක හෝ යෙදුම් සඳහා ලබා දී ඇති අවසරයන් (ඊමේල්, දින දර්ශනය, ස්වයංක්‍රීයකරණය ආදිය වෙත ප්‍රවේශය) ප්‍රවේශමෙන් සමාලෝචනය කරන්න. මෙම බාධක විභව බලපෑම සැලකිය යුතු ලෙස අඩු කරයි.

තාක්ෂණික කණ්ඩායම් සඳහා, බහුමාධ්‍ය පූර්ව සැකසුම් විගණනය කිරීම, ක්‍රියාකාරී වැලිපිල්ල දැඩි කිරීම සහ අසාමාන්‍ය රටා පිළිබඳ වාර්තා කිරීම/අනතුරු ඇඟවීම රූප විශ්ලේෂණය කිරීමෙන් පසු මෙවලම් සක්‍රිය කිරීම. මෙය නිෂ්පාදන මට්ටමේ ආරක්ෂාවට අනුපූරක වේ.

සෑම දෙයක්ම පෙන්වා දෙන්නේ අප මුහුණ දෙන කාරණයයි වේගවත් එන්නත් කිරීමේ තවත් ප්‍රභේදයකි දෘශ්‍ය නාලිකා සඳහා යොදනු ලැබේ. වැළැක්වීමේ පියවර, යෙදවුම් සත්‍යාපනය සහ අනිවාර්ය තහවුරු කිරීම් සමඟ, සූරාකෑමේ සීමාව පටු වන අතර පරිශීලකයින් සහ ව්‍යාපාර සඳහා අවදානම සීමිත වේ.

බහුමාධ්‍ය ආකෘතිවල අන්ධ ස්ථානයක් කෙරෙහි පර්යේෂණය අවධානය යොමු කරයි: රූප පරිමාණය ප්‍රහාරක දෛශිකයක් බවට පත්විය හැකිය. පරීක්ෂා නොකර තැබුවහොත්, ආදානය පෙර සැකසූ ආකාරය තේරුම් ගැනීම, අවසර සීමා කිරීම සහ තීරණාත්මක ක්‍රියාමාර්ග ගැනීමට පෙර තහවුරු කිරීම් අවශ්‍ය කිරීම මගින් හුදු ස්නැප්ෂොට් එකක් සහ ඔබේ දත්ත වෙත පිවිසෙන දොරටුව අතර වෙනස ඇති කළ හැකිය.

දිගු කිරීම් AI-0 මගින් ජනනය කරන ලද රූප හඳුනා ගනී
අදාළ ලිපිය:
කෘත්‍රිම බුද්ධියෙන් රූපයක් නිර්මාණය කර ඇත්දැයි හඳුනා ගන්නේ කෙසේද: උගුලට වැටීමෙන් වැළකී සිටීමට මෙවලම්, දිගු කිරීම් සහ උපක්‍රම.