- Yan ni awọn ipele: imọ-ẹrọ kiakia ni akọkọ, lẹhinna yiyi kiakia, ati ti o ba jẹ dandan, atunṣe daradara.
- RAG ṣe igbelaruge awọn idahun pẹlu igbapada atunmọ; awọn ti o tọ tọ idilọwọ hallucinations.
- Didara data ati igbelewọn lemọlemọ ṣe pataki ju eyikeyi ẹtan kan lọ.
Aala laarin Ohun ti o ṣaṣeyọri pẹlu awọn itara ti o dara ati ohun ti o ṣaṣeyọri nipasẹ ṣiṣe-tuntun awoṣe kan O jẹ arekereke diẹ sii ju bi o ti dabi lọ, ṣugbọn agbọye rẹ ṣe iyatọ laarin awọn idahun alabọde ati awọn eto iwulo nitootọ. Ninu itọsọna yii, Emi yoo fihan ọ, pẹlu awọn apẹẹrẹ ati awọn afiwera, bii o ṣe le yan ati papọ ilana kọọkan lati ṣaṣeyọri awọn abajade to lagbara ni awọn iṣẹ akanṣe gidi-aye.
Ibi-afẹde kii ṣe lati duro ni imọ-jinlẹ, ṣugbọn lati fi si iṣe lojoojumọ: nigbati imọ-ẹrọ kiakia tabi yiyi kiakia ba to fun ọ, Nigbawo ni o tọ lati ṣe idoko-owo ni atunṣe to dara?, Bawo ni gbogbo eyi ṣe baamu si awọn ṣiṣan RAG, ati kini awọn iṣe ti o dara julọ dinku awọn idiyele, yiyara awọn iterations, ati yago fun gbigba sinu awọn opin ti o ku.
Kini imọ-ẹrọ kiakia, yiyi kiakia, ati atunṣe to dara?
Ṣaaju ki o to tẹsiwaju, jẹ ki a ṣe alaye diẹ ninu awọn imọran:
- Imọ-ẹrọ kiakia jẹ ọna ti ṣiṣe apẹrẹ awọn ilana ti o han gbangba pẹlu ọrọ asọye daradara ati awọn ireti. lati ṣe itọsọna awoṣe ti oṣiṣẹ tẹlẹ. Ninu a chatbot, fun apẹẹrẹ, n ṣalaye ipa, ohun orin, ọna kika, ati awọn apẹẹrẹ lati dinku aibikita ati ilọsiwaju deede laisi fifọwọkan awọn iwọn awoṣe.
- Titun-tuntun ṣe atunṣe awọn aye inu ti awoṣe ti a ti kọ tẹlẹ pẹlu data afikun lati agbegbe. lati ṣe atunṣe iṣẹ rẹ daradara lori awọn iṣẹ-ṣiṣe kan pato. O jẹ apẹrẹ nigbati o nilo awọn ọrọ-ọrọ amọja, awọn ipinnu idiju, tabi deede ti o pọju ni awọn agbegbe ifura (ilera, ofin, owo).
- Yiyi kiakia n ṣafikun awọn adaṣe ikẹkọ (awọn itọsi rirọ) ti awoṣe tumọ lẹgbẹẹ ọrọ titẹ siiKo ṣe atunṣe gbogbo awoṣe: o didi awọn iwuwo rẹ ati ki o ṣe iṣapeye nikan awọn “awọn orin” ti a fi sii. O jẹ ilẹ agbedemeji daradara nigbati o fẹ lati mu ihuwasi mu laisi idiyele ti iṣatunṣe itanran ni kikun.
Ninu apẹrẹ UX / UI, imọ-ẹrọ kiakia ṣe imudara mimọ ti ibaraenisepo eniyan-kọmputa (ohun ti Mo nireti ati bii MO ṣe beere fun), lakoko ti iṣatunṣe itanran pọ si ibaramu ati aitasera ti iṣelọpọ. Ni idapo, gba fun diẹ wulo, yiyara, ati ki o gbẹkẹle atọkun.
Imọ-ẹrọ kiakia ni ijinle: awọn ilana ti o gbe abẹrẹ naa
Imọ-ẹrọ kiakia kii ṣe nipa idanwo afọju. O wa awọn ọna eto ti o mu didara dara laisi fifọwọkan awoṣe tabi data ipilẹ rẹ:
- Diẹ-shot vs odo-shot. en diẹ-shot O fi awọn apẹẹrẹ ti a yan daradara diẹ sii ki awoṣe naa gba apẹrẹ gangan; ninu odo-shot O gbẹkẹle awọn ilana ti o han gbangba ati awọn owo-ori laisi awọn apẹẹrẹ.
- Awọn ifihan ni ipo. Ṣe afihan ọna kika ti a reti (titẹ sii → iṣelọpọ) pẹlu awọn orisii-kekere. Eyi dinku awọn aṣiṣe kika ati ṣe deede awọn ireti, ni pataki ti o ba nilo awọn aaye kan pato, awọn aami, tabi awọn aza ni idahun.
- Awọn awoṣe ati awọn oniyipadaSetumo ta pẹlu placeholders fun iyipada data. Awọn itọka ti o ni agbara jẹ bọtini nigbati ọna titẹ sii ba yatọ, fun apẹẹrẹ, ni fọọmu data mimọ tabi fifọ ni ibi ti igbasilẹ kọọkan de ni ọna kika ọtọtọ.
- Awọn olusọ ọrọWọn jẹ "awọn onitumọ" laarin aaye ọrọ ti awoṣe ati awọn ẹka iṣowo rẹ (fun apẹẹrẹ, aworan aworan "ayọ" → "rere"). Yiyan awọn olutọsọna ti o dara mu ilọsiwaju aami ati aitasera dara si, ni pataki ni itupalẹ itara ati isọdi akori.
- Awọn gbolohun ọrọ kiakia (pipe ni kiakia). Fọ iṣẹ-ṣiṣe eka kan si awọn igbesẹ: akopọ → jade awọn metiriki → itupalẹ itara. Ṣiṣakopọ awọn igbesẹ papọ jẹ ki eto diẹ sii yokokoro ati logan, ati nigbagbogbo mu didara dara ni akawe si “beere fun ohun gbogbo ni ẹẹkan.”
- Awọn iṣe kika ti o dara: samisi awọn ipa ("O jẹ oluyanju ..."), asọye ara ("idahun ni awọn tabili / JSON"), ṣe agbekalẹ awọn ilana igbelewọn (“penalizes hallucinations, sọ awọn orisun nigba ti wọn wa”) ati ṣalaye kini lati ṣe ni iṣẹlẹ ti aidaniloju (fun apẹẹrẹ, “ti data ba sonu, tọka 'aimọ'”).
Awọn paati atunṣe kiakia
Ni afikun si awọn itọsi ti ara, yiyi kiakia n ṣafikun awọn itọsi rirọ (awọn ifibọ ikẹkọ) ti o ṣaju igbewọle naa. Lakoko ikẹkọ, gradient n ṣatunṣe awọn ipa-ọna wọnyẹn lati mu iṣẹjade sunmọ ibi-afẹde naa. lai ni ipa lori awọn awoṣe ká miiran òṣuwọn. O wulo nigbati o fẹ gbigbe ati awọn idiyele kekere.
O gbe LLM silẹ (fun apẹẹrẹ, GPT-2 tabi iru), mura awọn apẹẹrẹ rẹ ati ti o mura awọn asọ ti ta fun kọọkan titẹsiO ṣe ikẹkọ awọn ifibọ wọnyẹn nikan, nitorinaa awoṣe “ri” iṣapeye iṣapeye ti o ṣe itọsọna ihuwasi rẹ ninu iṣẹ-ṣiṣe rẹ.
Ohun elo to wulo: Ninu chatbot iṣẹ alabara, o le pẹlu awọn ilana ibeere aṣoju ati ohun orin idahun to dara julọ ni awọn itọra rirọ. Eyi ṣe iyara aṣamubadọgba laisi mimu awọn ẹka oriṣiriṣi ti awọn awoṣe. tabi jẹ diẹ sii GPU.
Ni-ijinle itanran yiyi: nigbawo, bawo, ati pẹlu ohun ti iṣọra
Tunṣe atunṣe to dara (apa kan tabi patapata) awọn iwuwo LLM pẹlu ipilẹ data ibi-afẹde kan. lati ṣe pataki. Eyi ni ọna ti o dara julọ nigbati iṣẹ-ṣiṣe ba yapa lati ohun ti awoṣe rii lakoko ikẹkọ iṣaaju tabi nilo awọn ọrọ-ọrọ ti o dara ati awọn ipinnu.
O ko bẹrẹ lati kan òfo sileti: iwiregbe-aifwy si dede bi gpt-3.5-turbo Wọn ti wa ni aifwy tẹlẹ lati tẹle awọn itọnisọna. Titunse itanran rẹ “dahun” si ihuwasi yẹn, eyiti o le jẹ arekereke ati aidaniloju, nitorinaa o jẹ imọran ti o dara lati ṣe idanwo pẹlu apẹrẹ ti awọn ọna ṣiṣe eto ati awọn igbewọle.
Diẹ ninu awọn iru ẹrọ gba ọ laaye lati pq orin ti o dara lori ọkan ti o wa tẹlẹ. Eyi ṣe okunkun awọn ifihan agbara to wulo ni idiyele kekere. lati tun lati ibere, ati ki o dẹrọ afọwọsi-itọsọna iterations.
Awọn imọ-ẹrọ ti o munadoko gẹgẹbi LoRA fi awọn matrices ipo-kekere sii lati ṣe deede awoṣe pẹlu awọn aye tuntun diẹ. Anfani: lilo kekere, awọn imuṣiṣẹ agile ati iyipada (o le "yọ" aṣamubadọgba laisi fọwọkan ipilẹ).
Afiwera: yiyi kiakia vs tuning itanran
- IlanaImudani ti o dara ṣe imudojuiwọn awọn iwọn awoṣe pẹlu aami data ti ibi-afẹde kan; yiyi ni kiakia di awoṣe ati ṣatunṣe awọn ifibọ ikẹkọ nikan ti o ni asopọ si titẹ sii; imọ-ẹrọ kiakia ṣe iṣapeye ọrọ itọnisọna ati awọn apẹẹrẹ ti ko ni ikẹkọ.
- Eto sileNi atunṣe to dara, o ṣe atunṣe nẹtiwọki; ni yiyi kiakia, o kan "awọn itọsẹ rirọ." Ninu imọ-ẹrọ kiakia, ko si atunṣe parametric, ṣe apẹrẹ nikan.
- Ọna titẹ siiTitunse daradara ni igbagbogbo bọwọ fun kika atilẹba; yiyi kiakia ṣe atunṣe titẹ sii pẹlu awọn ifibọ ati awọn awoṣe; ṣiṣe imọ-ẹrọ kiakia n mu ede ẹda ti a ṣeto (awọn ipa, awọn ihamọ, awọn apẹẹrẹ).
- OroTitunse daradara jẹ gbowolori diẹ sii (iṣiro, data, ati akoko); yiyi kiakia jẹ daradara siwaju sii; Imọ-ẹrọ kiakia jẹ lawin ati iyara lati ṣe atunbere ti ọran naa ba gba laaye.
- Idi ati awọn ewuTitun-titun ṣe iṣapeye taara si iṣẹ-ṣiṣe, imukuro eewu ti apọju; yiyi kiakia ni ibamu pẹlu ohun ti a ti kọ tẹlẹ ninu LLM; imọ-ẹrọ kiakia n dinku awọn hallucinations ati awọn aṣiṣe kika pẹlu awọn iṣe ti o dara julọ laisi fọwọkan awoṣe.
Data ati awọn irinṣẹ: idana ti iṣẹ
- Didara data akọkọ: iwosan, deduplication, iwontunwosi, eti irú agbegbe ati ọlọrọ metadata Wọn jẹ 80% ti abajade, boya o ṣe atunṣe daradara tabi yiyi kiakia.
- Laifọwọyi pipelinesAwọn iru ẹrọ imọ-ẹrọ data fun AI ipilẹṣẹ (fun apẹẹrẹ, awọn ojutu ti o ṣẹda awọn ọja data atunlo) ṣe iranlọwọ lati ṣepọ, yipada, firanṣẹ ati atẹle awọn ipilẹ data fun ikẹkọ ati igbelewọn. Awọn imọran bii “Nexsets” ṣe apejuwe bi o ṣe le ṣe akopọ data ti o ṣetan fun lilo awoṣe.
- Loop esi: Gba awọn ifihan agbara lilo gidi-aye (awọn aṣeyọri, awọn aṣiṣe, awọn ibeere ti a beere nigbagbogbo) ki o fun wọn pada si awọn itọsi rẹ, awọn itọ rirọ, tabi awọn ipilẹ data. O jẹ ọna ti o yara ju lati jèrè deede.
- reproducibility: Awọn ikede awọn ẹya, awọn itọsi rirọ, data, ati awọn iwuwo ti a ṣe deede. Laisi wiwa kakiri, ko ṣee ṣe lati mọ kini iṣẹ ṣiṣe yipada tabi lati pada si ipo to dara ti aṣetunṣe ba kuna.
- GbogbogboNigbati awọn iṣẹ ṣiṣe tabi awọn ede ba n pọ si, rii daju pe awọn olusọ ọrọ rẹ, awọn apẹẹrẹ, ati awọn akole ko ṣe deede si agbegbe kan pato. Ti o ba n yi awọn inaro pada, o le nilo lati ṣe atunṣe-tuntun ina diẹ tabi lo awọn itọsi rirọ titun.
- Kini ti MO ba yi itọka naa pada lẹhin titun-tuntun? Ni gbogbogbo, bẹẹni: awoṣe yẹ ki o ṣe afihan awọn aṣa ati awọn iwa lati ohun ti o kọ, kii ṣe awọn ami-ami nikan. Iyẹn gangan ni aaye ti engine inference.
- Pa lupu naa pẹlu awọn metirikiNi ikọja deede, o ṣe iwọn kika ti o pe, agbegbe, itọkasi orisun ni RAG, ati itẹlọrun olumulo. Ohun ti a ko wọn ko ni ilọsiwaju.
Yiyan laarin awọn itọsi, yiyi ni kiakia ati iṣatunṣe itanran kii ṣe ọrọ ti dogma ṣugbọn ti ọrọ-ọrọ.: awọn idiyele, awọn iwọn akoko, eewu aṣiṣe, wiwa data, ati iwulo fun oye. Ti o ba kan awọn ifosiwewe wọnyi, imọ-ẹrọ yoo ṣiṣẹ ni ojurere rẹ, kii ṣe ọna miiran ni ayika.
Olootu amọja ni imọ-ẹrọ ati awọn ọran intanẹẹti pẹlu diẹ sii ju ọdun mẹwa ti iriri ni oriṣiriṣi awọn media oni-nọmba. Mo ti ṣiṣẹ bi olootu ati olupilẹṣẹ akoonu fun iṣowo e-commerce, ibaraẹnisọrọ, titaja ori ayelujara ati awọn ile-iṣẹ ipolowo. Mo tun ti kọ lori eto-ọrọ, iṣuna ati awọn oju opo wẹẹbu awọn apakan miiran. Iṣẹ mi tun jẹ ifẹ mi. Bayi, nipasẹ awọn nkan mi ninu Tecnobits, Mo gbiyanju lati ṣawari gbogbo awọn iroyin ati awọn anfani titun ti aye ti imọ-ẹrọ ti nfun wa ni gbogbo ọjọ lati mu igbesi aye wa dara.