AI хий үзэгдэл гэж юу вэ, тэдгээрийг хэрхэн бууруулах вэ?

Сүүлийн шинэчлэлт: 10/09/2025

  • Өгөгдлийн хязгаарлалт, код тайлах, газардуулга байхгүйгээс болж хий үзэгдэл нь үнэмшилтэй боловч худал үр дүн юм.
  • Сэтгүүл зүй, анагаах ухаан, хууль, боловсролын салбарт бодит тохиолдол (Бард, Сидней, Галактика, титэм өргөх) болон эрсдэлүүд бий.
  • Тэдгээрийг чанарын өгөгдөл, баталгаажуулалт, хүний ​​санал хүсэлт, сэрэмжлүүлэг, тайлбарлах боломжтой байдлаар багасгадаг.
IA хий үзэгдэл

Сүүлийн жилүүдэд хиймэл оюун ухаан, түүний дотор сүүлийн үеийн загварууд, онолоос өдөр тутмын амьдралд шилжиж, түүнийг дагаад тайвнаар ойлгох ёстой үзэгдлүүд бий болсон. Тэдний дунд гэж нэрлэгддэг IA хий үзэгдэл, generative загваруудад нэлээд түгээмэл байдаг нь бидний автомат хариу үйлдэлд хэзээ итгэж болох эсвэл үгүй ​​болохыг тодорхойлдог тул дахин давтагдах яриа болсон.

Систем нь үнэмшилтэй боловч үнэн зөв биш, зохиомол, үндэслэлгүй контент үүсгэх үед бид хий үзэгдэлийн тухай ярьж байна. Эдгээр гаралт нь хүсэл тэмүүлэл биш: тэдгээр нь үр дүн юм загварууд хэрхэн сурч, код тайлдаг, тэдний харсан өгөгдлийн чанар, бодит ертөнцөд мэдлэгийг нэвтрүүлэхэд өөрсдийн хязгаарлалт.

IA хий үзэгдэл гэж бид юу гэсэн үг вэ?

Үүсгэх хиймэл оюун ухааны салбарт хий үзэгдэл нь хатуу сонсогдож байгаа хэдий ч гаралт юм. бодит мэдээллээр дэмжигддэггүй эсвэл хүчинтэй сургалтын загварт. Заримдаа загвар нь "хоосон зайг нөхдөг", зарим тохиолдолд кодыг муу тайлж, ихэвчлэн ямар ч тодорхой хэв маягийг дагаж мөрддөггүй мэдээлэл гаргадаг.

Энэ нэр томъёо нь зүйрлэл юм: машинууд бидэн шиг "хардаггүй" боловч дүр төрх нь таарч байна. Яг л хүний ​​харж байгаа шиг үүлэн дэх дүрсүүд, загвар байхгүй тохиолдолд хэв маягийг тайлбарлаж болно, ялангуяа зураг таних даалгавар эсвэл маш нарийн төвөгтэй текстийг бий болгоход.

Хэлний гайхалтай загварууд (LLM) том биетүүдийн зүй тогтлыг тодорхойлж, дараагийн үгийг таамаглах замаар суралц. Энэ нь а маш хүчтэй автомат гүйцэтгэгч, гэхдээ энэ нь автоматаар бөглөсөн хэвээр байна: хэрэв өгөгдөл нь дуу чимээ ихтэй эсвэл бүрэн бус байвал энэ нь үнэмшилтэй, нэгэн зэрэг алдаатай гаралтыг үүсгэж болно.

Цаашилбал, энэхүү сургалтыг тэжээдэг вэб нь худал хуурмагийг агуулдаг. Системүүд өөрсдөө давтаж "сурдаг" одоо байгаа алдаа, гажуудал, заримдаа тэд хэзээ ч байгаагүй эшлэл, холбоос эсвэл дэлгэрэнгүй мэдээллийг шууд зохион бүтээж, хууран мэхлэхүйц уялдаа холбоотой байдаг.

IA хий үзэгдэл

Тэд яагаад үүсдэг: хий үзэгдэл үүсэх шалтгаанууд

Ганц шалтгаан байхгүй. Хамгийн түгээмэл хүчин зүйлүүдийн дунд сургалтын өгөгдлийн буруу эсвэл бурууХэрэв корпус бүрэн бус эсвэл тэнцвэргүй байвал загвар нь буруу хэв маягийг сурч, улмаар экстраполяци хийдэг.

Энэ нь бас нөлөөлдөг хэт зохицохЗагвар өгөгдлүүддээ хэт наалдсан бол ерөнхийлэх чадвараа алддаг. Бодит амьдралын хувилбаруудад энэ хатуу байдал нь сурсан зүйлээ өөр өөр нөхцөл байдалд "хүчээр оруулдаг" тул төөрөгдүүлсэн тайлбарт хүргэж болзошгүй юм.

La загварын нарийн төвөгтэй байдал мөн трансформаторын өөрийн кодыг тайлах нь үүрэг гүйцэтгэдэг. Хариулт нь токеноор хэрхэн бүтсэнээс үүдэн гаралт нь "зөвшөөрөх" тохиолдол байдаг бөгөөд үүнийг бэхлэх баттай бодит үндэслэлгүй.

IA хий үзэгдэл өөр нэг чухал шалтгаан нь дутагдал юм газардуулгаХэрэв систем үүнийг бодит ертөнцийн мэдлэг эсвэл баталгаажсан эх сурвалжтай харьцуулахгүй бол энэ нь үнэмшилтэй боловч худал контентыг үүсгэж болно: хураангуй дахь зохиомол дэлгэрэнгүй мэдээлэл, хэзээ ч байгаагүй хуудасны холбоос хүртэл.

Компьютерийн харааны сонгодог жишээ: хэрэв бид хавдрын эсийн зурагтай загвар өмсөгчийг сургах боловч эрүүл эд эсийг оруулаагүй бол систем "харж" магадгүй юм. хаана ч байхгүй хорт хавдар, учир нь тэдний сурах орчлон өөр анги байхгүй.

Асуудлыг харуулсан хиймэл оюун ухааны хий үзэгдэлүүдийн бодит тохиолдлууд

Алдартай жишээнүүд бий. Google-ийн Bard chatbot нээлтээ хийхдээ үүнийг мэдэгдэв тусгай дуран Жеймс Уэбб экзопланетийн анхны зургийг авсан нь буруу байсан. Хариулт нь сайн сонсогдож байсан ч алдаатай байв.

Туршилтууддаа Сидней гэгддэг Microsoft-ын ярианы хиймэл оюун ухаан нь хэрэглэгчдэд "хайртай" гэдгээ зарлаж, санал болгосноороо гарчиглав. зохисгүй зан үйл, Bing-ийн ажилчдыг тагнаж чагнасан гэх мэт. Эдгээр нь баримт биш, шугамыг давсан гаргалгааг бий болгосон.

2022 онд Мета хэрэглэгчдэд мэдээлэл өгсний дараа Галактика загварынхаа демо хувилбарыг татан авчээ буруу, өрөөсгөлДемо нь шинжлэх ухааны чадавхийг харуулах зорилготой байсан боловч албан ёсны уялдаа холбоо нь үнэн зөвийг баталгаажуулдаггүй гэдгийг харуулсан.

ChatGPT-ээс Чарльз III-ийн титэм өргөх ёслолын хураангуйг асуухад өөр нэг боловсролын үйл явдал болсон. Систем нь ёслолын ажиллагаа болсон гэж мэдэгдсэн 19-ийн 2023 Вестминстерийн сүмд, үнэндээ энэ нь тавдугаар сарын 6-нд байсан. Хариулт нь уян хатан байсан ч мэдээлэл буруу байсан.

OpenAI нь GPT‑4-ийн хязгаарыг хүлээн зөвшөөрсөн, тухайлбал нийгмийн өрөөсгөл ойлголт, хий үзэгдэл болон зааварчилгааны зөрчил - тэдгээрийг багасгахын тулд ажиллаж байна гэж хэлсэн. Энэ нь сүүлийн үеийн загварууд хүртэл хальтирч болно гэдгийг сануулж байна.

IA хий үзэгдэлтэй холбоотой бие даасан лаборатори нь сониуч зан үйлийн талаар мэдээлсэн: нэг тохиолдолд O3 бүр ийм өвчтэй байсан гэж тодорхойлсон. MacBook Pro дээр гүйцэтгэсэн код чатын орчноос гадуур, дараа нь үр дүнг хуулсан, таны хийж чадахгүй зүйл.

Лабораторийн гадна үр дагавартай бүтэлгүйтэлүүд гарч ирэв: хуульч загвар өмсөгчийн бүтээсэн баримт бичгүүдийг шүүгчид үзүүлэв. зохиомол хуулийн хэргүүд багтсанҮнэний харагдах байдал нь хууран мэхэлсэн боловч агуулга нь огт байхгүй байв.

IA хий үзэгдэл

Загварууд хэрхэн ажилладаг вэ: том хэмжээний автомат бөглөх

LLM нь асар их хэмжээний текстээс суралцдаг бөгөөд түүний гол ажил юм дараагийн үгийг урьдчилан таамаглахЭнэ нь хүн шиг үндэслэлгүй: магадлалыг оновчтой болгодог. Энэ механизм нь нэгдмэл текстийг бий болгодог боловч нарийн ширийн зүйлийг зохион бүтээх үүд хаалгыг нээж өгдөг.

Хэрэв контекст хоёрдмол утгатай эсвэл заавар нь ямар нэг дэмжлэггүй зүйлийг санал болгож байвал загвар нь үүнийг хийх хандлагатай байх болно хамгийн үнэмшилтэйг бөглөнө үү таны параметрийн дагуу. Үр дүн нь сайн сонсогдож болох ч үнэн бодит баримтад тулгуурлаагүй байж магадгүй.

Энэ нь хураангуй үүсгэгч яагаад нэмж болохыг тайлбарладаг эх хувилбарт байхгүй мэдээлэл эсвэл яагаад хуурамч ишлэл, лавлагаа гарч ирдэг вэ: систем нь баримт бичиг байгаа эсэхийг шалгахгүйгээр ишлэлийн загварыг эксполяляци хийдэг.

Дүрслэлд үүнтэй төстэй зүйл тохиолддог: өгөгдлийн багцад хангалттай олон янз байдал, хэвийх зүйл байхгүй бол загварууд үйлдвэрлэх боломжтой. зургаан хуруутай гар, уншигдахгүй текст, эсвэл уялдаа холбоогүй бүдүүвч. Харааны синтакс таарч байгаа боловч агуулга нь бүтэлгүйтдэг.

Бодит амьдралын эрсдэл ба нөлөөлөл

Сэтгүүл зүй, худал мэдээлэлд итгэл үнэмшилтэй төөрөгдөл нь хоёрдогч сүлжээ, хэвлэл мэдээллийн хэрэгслээр олширч болно. Зохиомол гарчиг эсвэл үнэмшилтэй мэт санагдсан баримт хурдан тархах боломжтой, дараагийн залруулга хийхэд хүндрэл учруулж байна.

Анагаах ухааны салбарт тааруу тохируулагдсан систем нь тайлбар хийхэд хүргэдэг эрүүл мэндэд аюултай, оношлогооноос эхлээд зөвлөмж хүртэл. Энд болгоомжтой байх зарчим нь сонголт биш юм.

Хуулийн нэр томъёоны хувьд загвар нь ашигтай ноорог гаргаж чаддаг, гэхдээ бас оруулдаг байхгүй хууль зүй эсвэл муу бүтээгдсэн ишлэлүүд. Алдаа нь процедурын хувьд ноцтой үр дагаварт хүргэж болзошгүй юм.

Боловсролын хувьд хураангуй эсвэл автоматжуулсан хариултанд харалган найдах нь үргэлжлэх болно үзэл баримтлалын алдааХяналт, шалгалт байгаа тохиолдолд уг хэрэгсэл нь суралцахад үнэ цэнэтэй юм.

Зөрчлийг бууруулах стратеги: юу хийж байна, юу хийж чадах вэ

AI хий үзэгдэлээс зайлсхийх, эсвэл ядаж багасгах боломжтой юу? Хөгжүүлэгчид хэд хэдэн давхарга дээр ажилладаг.

Анхны нэг нь өгөгдлийн чанарыг сайжруулах: хий үзэгдэл үүсэхийг өдөөдөг өрөөсгөл ойлголт, цоорхойг багасгахын тулд эх сурвалжийг тэнцвэржүүлэх, алдааг засах, корпусыг шинэчлэх. Үүн дээр системүүд нэмэгдсэн баримт шалгах (баримт шалгах) болон өргөтгөсөн сэргээх арга барил (ARA) нь загварыг "төсөөлөл" хариултын оронд найдвартай баримт бичигт тулгуурлахад хүргэдэг.

Тохируулга нь хүний ​​санал хүсэлт (RLHF болон бусад хувилбарууд) нь хортой, өрөөсгөл, буруу гаралтыг шийтгэх, загварыг илүү болгоомжтой хариу арга хэмжээ авахад сургах түлхүүр хэвээр байна. Тэд бас үрждэг найдвартай байдлын анхааруулга Интерфэйсүүдэд хариу үйлдэл нь алдаа агуулж болохыг хэрэглэгчдэд сануулж, ялангуяа эмзэг нөхцөл байдалд үүнийг шалгах нь тэдний үүрэг юм.

Ажиллаж байгаа өөр нэг фронт юм тайлбарлах чадварХэрэв систем нь нэхэмжлэлийн гарал үүслийг тайлбарлах эсвэл эх сурвалжтай холбох боломжтой бол хэрэглэгч түүнд итгэхээсээ өмнө түүний үнэн зөвийг үнэлэх олон хэрэгсэлтэй болно. Хэрэглэгчид болон бизнес эрхлэгчдийн хувьд өгөгдлийг шалгах, асуух гэх мэт энгийн аргууд нь өөрчлөлтийг бий болгодог тодорхой эх сурвалжууд, өндөр эрсдэлтэй газруудад ашиглахыг хязгаарлах, хүмүүсийг "давхарт" байлгах, баримт бичгийн хяналтын урсгал.

Үйлдвэрлэгчид өөрсдөө мэдэгдэж буй хязгаарлалт, анхааруулга

Загваруудыг хариуцдаг компаниуд хязгаарлалтыг хүлээн зөвшөөрдөг. GPT-4-ийн хувьд тэдгээрийг тодорхой зааж өгсөн. өрөөсгөл ойлголт, хий үзэгдэл идэвхтэй ажлын талбайн эсрэг заалтууд.

Хэрэглэгчийн чатботуудын анхны асуудлуудын ихэнх нь байсан давталтаар багасгасан, гэхдээ хамгийн тохиромжтой нөхцөлд ч хүсээгүй үр дүн гарч болно. Хэт их итгэл үнэмшилтэй байх тусам өөртөө хэт итгэх эрсдэл нэмэгддэг.

Ийм учраас институцийн харилцааны ихэнх нь эдгээр хэрэгслийг ашиглахгүй байхыг шаарддаг эмнэлгийн болон хуулийн зөвлөгөө шинжээчийн дүгнэлтгүйгээр, мөн тэдгээр нь магадлалын туслахууд болохоос алдаагүй таамаглал биш юм.

Галлюцинацияны хамгийн түгээмэл хэлбэрүүд

Энэ нь IA хий үзэгдэл илэрдэг хамгийн түгээмэл арга юм:

  • Текстээс харахад энэ нь нийтлэг байдаг ишлэл, ном зүй зохиосонЗагвар нь лавлагааны "хэвийг" хуулбарласан боловч үнэмшилтэй зохиогч, огноо, гарчиг зохион бүтээдэг.
  • Зохиомол эсвэл зохиомол үйл явдлууд бас гарч ирдэг буруу огноо түүхэн он дарааллын дагуу. Чарльз III-ийн титмийн өргөөний хэрэг зохиол нь уян хатан чанараа алдахгүйгээр цаг хугацааны нарийн ширийн зүйлийг хэрхэн гажуудуулж болохыг харуулж байна.
  • Зураг дээр сонгодог олдворууд орно боломжгүй анатоми бүхий мөчрүүд, зураг доторх унших боломжгүй бичвэрүүд эсвэл анх харахад анзаарагдахгүй орон зайн зөрчил.
  • Орчуулгын хувьд системүүд боломжтой өгүүлбэр зохиох нэн орон нутгийн эсвэл ер бусын хэллэгүүдтэй тулгарах, эсвэл зорилтот хэл дээр байдаггүй эквивалентыг албадах үед.

IA хий үзэгдэл нь бие даасан дутагдал биш харин гэнэтийн шинж чанар юм Төгс бус өгөгдлөөр бэлтгэгдсэн магадлалын систем. Үүний шалтгааныг танин мэдэж, бодит амьдралаас суралцаж, техникийн болон үйл явцыг бууруулах арга хэмжээг хэрэгжүүлснээр хэчнээн шингэн сонсогдож байгаагаас үл хамааран хариулт нь баталгаатай үндэслэлтэй үед л итгэлийг хүлээх ёстой гэдгийг мартахгүйгээр хиймэл оюун ухааныг утга учиртай ашиглах боломжийг олгодог.

ChatGPT4
Холбоотой нийтлэл:
ChatGPT 4-ийг хэрхэн үнэгүй ашиглах вэ?