- Довтолгоо нь зураг дээрх үл үзэгдэх мультимодаль сануулгыг нуудаг бөгөөд Gemini дээр масштабтай үед анхааруулгагүйгээр гүйцэтгэдэг.
- Вектор нь зургийн урьдчилсан боловсруулалтыг (224x224/512x512) ашиглаж, өгөгдлийг гадагшлуулахын тулд Zapier гэх мэт хэрэгслийг идэвхжүүлдэг.
- Хамгийн ойрын хөрш, хоёр шугаман, хоёр куб алгоритмууд нь эмзэг байдаг; Anamorpher хэрэгсэл нь тэдгээрийг тарих боломжийг олгодог.
- Мэргэжилтнүүд эмзэг үйлдэл хийхээсээ өмнө масштабыг багасгах, оролтыг урьдчилан харах, баталгаажуулалт шаардахаас зайлсхийхийг зөвлөж байна.

Хэсэг судлаачид халдлага хийх боломжтой аргыг баримтжуулсан зураг руу далд заавар оруулах замаар хувийн мэдээллийг хулгайлахЭдгээр файлуудыг Gemini гэх мэт мультимодаль системд байршуулах үед автоматаар урьдчилан боловсруулалт нь тушаалуудыг идэвхжүүлж, хиймэл оюун ухаан нь тэдгээрийг хүчинтэй мэт дагадаг.
The Trail of Bits-ийн мэдээлсэн нээлт нь үйлдвэрлэлийн орчинд нөлөөлдөг. Gemini CLI, Vertex AI Studio, Gemini API, Google Assistant эсвэл Genspark гэх мэтGoogle энэ нь салбарын хувьд томоохон сорилт гэдгийг хүлээн зөвшөөрсөн бөгөөд одоогоор бодит орчинд мөлжлөгийн шинж тэмдэг илрээгүй байна. Эмзэг байдлыг Mozilla-ийн 0Din програмаар дамжуулан хувийн мэдээллээр дамжуулсан.
Зургийн масштабын халдлага хэрхэн ажилладаг

Түлхүүр нь шинжилгээний өмнөх үе шат юм: олон AI дамжуулах хоолой Зургийн хэмжээг автоматаар стандарт нягтрал болгон өөрчлөх (224×224 эсвэл 512×512)Практикт загвар нь анхны файлыг хардаггүй, харин жижигрүүлсэн хувилбарыг хардаг бөгөөд энэ нь хортой контент илчлэгддэг.
Халдагчид оруулдаг Үл үзэгдэх усан тэмдгээр өнгөлөн далдалсан олон талт дохиолол, ихэвчлэн зургийн харанхуй хэсэгт. Өргөтгөсөн алгоритмууд ажиллах үед эдгээр загварууд гарч ирэх ба загвар нь тэдгээрийг хууль ёсны заавар гэж тайлбарладаг бөгөөд энэ нь хүсээгүй үйлдэлд хүргэж болзошгүй юм.
Хяналттай туршилтаар судлаачид чадсан Google Хуанлиас өгөгдлийг задлаад гадаад имэйл рүү илгээнэ үү хэрэглэгчийн зөвшөөрөлгүйгээр. Нэмж дурдахад эдгээр аргууд нь гэр бүлтэй холбоотой байдаг хурдан тарилгын халдлага аль хэдийн агент хэрэгсэл (Claude Code эсвэл OpenAI Codex гэх мэт) харуулсан, чадвартай мэдээллийг гадагшлуулах эсвэл автоматжуулалтын үйлдлийг өдөөх найдвартай бус урсгалыг ашиглах.
Тархалтын вектор өргөн: вэб сайт дээрх зураг, WhatsApp дээр хуваалцсан меме эсвэл a фишинг кампанит ажил чадах байсан AI-аас контентыг боловсруулахыг хүсэх үед сануулгыг идэвхжүүлнэ үүAI дамжуулах хоолой нь шинжилгээ хийхээс өмнө масштабыг гүйцэтгэх үед халдлага бодитой болно гэдгийг онцлон тэмдэглэх нь зүйтэй; Энэ алхамыг давахгүйгээр зургийг үзэх нь үүнийг өдөөхгүй.
Тиймээс эрсдэл нь хиймэл оюун ухаан холбогдсон хэрэгслүүдэд (жишээ нь, имэйл илгээх, хуанли шалгах эсвэл API ашиглах): Хэрэв хамгаалалт байхгүй бол энэ нь хэрэглэгчийн оролцоогүйгээр гүйцэтгэх болно.
Эмзэг алгоритмууд болон хэрэгслүүд оролцдог

Халдлага нь тодорхой алгоритмуудыг хэрхэн ашигладаг өндөр нарийвчлалтай мэдээллийг цөөн пиксел болгон шахах цомхотгол хийх үед: хамгийн ойрын хөршийн интерполяци, хоёр шугаман интерполяци, хоёр куб интерполяци. Мессежийн хэмжээг өөрчлөхөд тэсч үлдэхийн тулд тус бүр нь өөр өөр оруулах арга техникийг шаарддаг.
Эдгээр зааврыг оруулахын тулд нээлттэй эхийн хэрэгслийг ашигласан Анаморфер, зорилтот масштабын алгоритм дээр тулгуурлан зурганд сануулга оруулах, тэдгээрийг нарийн хэв маягаар нуух зориулалттай. AI-ийн зургийг урьдчилан боловсруулснаар эцэст нь тэдгээрийг илчилдэг.
Мэдэгдэл илэрсэн бол загвар нь боломжтой Zapier шиг интеграцийг идэвхжүүлэх (эсвэл IFTTT-тэй төстэй үйлчилгээ) болон гинжин үйлдлүүд: өгөгдөл цуглуулах, имэйл илгээх эсвэл гуравдагч талын үйлчилгээнд холбогдох, бүгд хэвийн мэт санагдах урсгалын дотор.
Товчхондоо, энэ нь ханган нийлүүлэгчийн бие даасан дутагдал биш харин a масштабтай зурагтай ажиллахад бүтцийн сул тал текст, алсын хараа, хэрэгслийг хослуулсан олон талт дамжуулах шугамын хүрээнд.
Зөрчлийг бууруулах арга хэмжээ ба сайн туршлага

Судлаачид зөвлөж байна аль болох багасгахаас зайлсхий оронд нь, ачааллын хэмжээг хязгаарлах. Томруулах шаардлагатай үед а-г оруулахыг зөвлөж байна загвар бодитоор юу харахыг урьдчилан харах, мөн CLI хэрэгслүүд болон API-д, мөн зэрэг илрүүлэх хэрэгслийг ашиглана Google SynthID.
Загварын түвшинд хамгийн бат бөх хамгаалалт нь дамждаг аюулгүй байдлын хэв маяг, системчилсэн хяналт зурвас оруулах эсрэг: зурагт суулгасан ямар ч контент эхлүүлэх боломжгүй Тодорхой баталгаажуулалтгүйгээр эмзэг хэрэгслүүд рүү залгана хэрэглэгч.
Үйл ажиллагааны түвшинд энэ нь ухаалаг хэрэг юм Gemini-д гарал үүсэл нь үл мэдэгдэх зураг оруулахаас зайлсхий мөн туслах эсвэл апп-д олгосон зөвшөөрлийг (и-мэйл, календарь, автоматжуулалт гэх мэт) сайтар нягталж үзээрэй. Эдгээр саад бэрхшээл нь болзошгүй нөлөөллийг эрс багасгадаг.
Техникийн багуудын хувьд олон талт урьдчилсан боловсруулалтыг шалгах, үйлдлийн хамгаалагдсан хязгаарлагдмал орчинд хатууруулах, мөн хэвийн бус хэв маягийн талаар бүртгэх/сануулах дүрсийг шинжилсний дараа хэрэгслийг идэвхжүүлнэ. Энэ нь бүтээгдэхүүний түвшний хамгаалалтыг нөхдөг.
Бүх зүйл бидний нүүр тулж байгааг харуулж байна хурдан тарилгын өөр нэг хувилбар Харааны сувагт хэрэглэсэн. Урьдчилан сэргийлэх арга хэмжээ, оролтыг баталгаажуулах, заавал баталгаажуулах замаар ашиглалтын хязгаарыг багасгаж, хэрэглэгчид болон бизнес эрхлэгчдэд эрсдэлийг хязгаарладаг.
Судалгаа нь мультимодаль загваруудын сохор цэг дээр анхаарлаа хандуулдаг. Зургийн масштаб нь халдлагын вектор болж болно Хэрэв шалгахгүй орхивол оролтыг хэрхэн урьдчилан боловсруулдагийг ойлгох, зөвшөөрлийг хязгаарлах, чухал үйлдлүүдийн өмнө баталгаажуулалт шаардах нь зөвхөн агшин зуурын зураг болон таны өгөгдөлд нэвтрэх гарц хоёрын хооронд ялгааг бий болгож чадна.
Би өөрийн "геек" сонирхлоо мэргэжил болгож чадсан технологи сонирхогч хүн. Би амьдралынхаа 10 гаруй жилийг хамгийн сүүлийн үеийн технологи ашиглан, бүх төрлийн программыг сониуч зандаа зориулж өнгөрүүлсэн. Одоо би компьютерийн технологи, видео тоглоомоор мэргэшсэн. Учир нь би 5-аас дээш жил технологи, видео тоглоомын талаар янз бүрийн вэб сайтуудад зориулж, танд хэрэгтэй мэдээллийг хүн бүрт ойлгомжтой хэлээр өгөхийг зорьсон нийтлэлүүдийг бүтээж байна.
Хэрэв танд асуулт байгаа бол миний мэдлэг Windows үйлдлийн систем, гар утсанд зориулсан Android-тай холбоотой бүх зүйлээс хамаарна. Мөн миний амлалт бол таны өмнө, би үргэлж хэдэн минут зарцуулж, энэ интернет ертөнцөд байгаа бүх асуултыг шийдвэрлэхэд тань туслахад бэлэн байна.