- ជ្រើសរើសតាមដំណាក់កាល៖ វិស្វកម្មភ្លាមៗ បន្ទាប់មកការលៃតម្រូវភ្លាមៗ ហើយប្រសិនបើចាំបាច់ ធ្វើការកែតម្រូវ។
- RAG បង្កើនការឆ្លើយតបជាមួយនឹងការទាញយក semantic; ការណែនាំត្រឹមត្រូវការពារការយល់ច្រឡំ។
- គុណភាពទិន្នន័យ និងការវាយតម្លៃបន្តមានសារៈសំខាន់ជាងល្បិចតែមួយ។

ព្រំដែនរវាង អ្វីដែលអ្នកសម្រេចបានដោយការបំផុសគំនិតល្អ និងអ្វីដែលអ្នកសម្រេចបានដោយការកែសម្រួលគំរូ វាមានភាពស្រទន់ជាងវា ប៉ុន្តែការយល់ដឹងវាធ្វើឱ្យមានភាពខុសគ្នារវាងការឆ្លើយតបមធ្យម និងប្រព័ន្ធដែលមានប្រយោជន៍ពិតប្រាកដ។ នៅក្នុងការណែនាំនេះ ខ្ញុំនឹងបង្ហាញអ្នកជាមួយនឹងឧទាហរណ៍ និងការប្រៀបធៀប របៀបជ្រើសរើស និងបញ្ចូលគ្នានូវបច្ចេកទេសនីមួយៗ ដើម្បីសម្រេចបានលទ្ធផលរឹងមាំនៅក្នុងគម្រោងជាក់ស្តែង។
គោលដៅគឺមិនមែនដើម្បីរក្សាទ្រឹស្ដីនោះទេ ប៉ុន្តែត្រូវអនុវត្តវាជារៀងរាល់ថ្ងៃ៖ នៅពេលដែលវិស្វកម្មភ្លាមៗ ឬការលៃតម្រូវភ្លាមៗគឺគ្រប់គ្រាន់សម្រាប់អ្នក។ តើនៅពេលណាដែលវាមានតម្លៃវិនិយោគលើការលៃតម្រូវ?របៀបដែលទាំងអស់នេះសមនឹងលំហូរ RAG និងការអនុវត្តល្អបំផុតកាត់បន្ថយការចំណាយ បង្កើនល្បឿននៃការធ្វើម្តងទៀត និងជៀសវាងការចូលទៅក្នុងទីបញ្ចប់។
តើអ្វីទៅជាវិស្វកម្មរហ័ស ការលៃតម្រូវភ្លាមៗ និងការលៃតម្រូវល្អ?
មុននឹងបន្ត យើងសូមបញ្ជាក់ពីគោលគំនិតមួយចំនួន៖
- វិស្វកម្មរហ័សគឺជាសិល្បៈនៃការរចនាការណែនាំច្បាស់លាស់ជាមួយនឹងបរិបទដែលបានកំណត់យ៉ាងល្អ និងការរំពឹងទុក។ ដើម្បីណែនាំគំរូដែលបានបណ្តុះបណ្តាលរួចហើយ។ ក្នុង ក chatbot ។ជាឧទាហរណ៍ កំណត់តួនាទី សម្លេង ទម្រង់លទ្ធផល និងឧទាហរណ៍ ដើម្បីកាត់បន្ថយភាពមិនច្បាស់លាស់ និងធ្វើឱ្យភាពត្រឹមត្រូវដោយមិនប៉ះទម្ងន់គំរូ។
- ការលៃតម្រូវការកែសម្រួលកែប្រែប៉ារ៉ាម៉ែត្រខាងក្នុងនៃគំរូដែលបានបណ្តុះបណ្តាលជាមុនជាមួយនឹងទិន្នន័យបន្ថែមពីដែន។ ដើម្បីកែសម្រួលការអនុវត្តរបស់អ្នកលើកិច្ចការជាក់លាក់។ វាល្អនៅពេលដែលអ្នកត្រូវការវាក្យស័ព្ទឯកទេស ការសម្រេចចិត្តដ៏ស្មុគស្មាញ ឬភាពត្រឹមត្រូវអតិបរមានៅក្នុងតំបន់រសើប (ការថែទាំសុខភាព ច្បាប់ ហិរញ្ញវត្ថុ)។
- ការលៃតម្រូវភ្លាមៗបន្ថែមវ៉ិចទ័រដែលអាចបណ្តុះបណ្តាលបាន (ការជម្រុញទន់) ដែលគំរូបកស្រាយស្របនឹងអត្ថបទបញ្ចូលវាមិនបង្ហាត់ម៉ូដែលទាំងមូលឡើងវិញទេ៖ វាបង្កកទម្ងន់របស់វា និងបង្កើនប្រសិទ្ធភាពតែ "បទ" ដែលបានបង្កប់ប៉ុណ្ណោះ។ វាជាចំណុចកណ្តាលដ៏មានប្រសិទ្ធភាពមួយ នៅពេលដែលអ្នកចង់សម្របឥរិយាបថដោយមិនចាំបាច់ចំណាយលើការកែតម្រូវពេញលេញ។
នៅក្នុងការរចនា UX/UI វិស្វកម្មភ្លាមៗធ្វើអោយប្រសើរឡើងនូវភាពច្បាស់លាស់នៃអន្តរកម្មរវាងមនុស្ស និងកុំព្យូទ័រ (អ្វីដែលខ្ញុំរំពឹងទុក និងរបៀបដែលខ្ញុំស្នើសុំវា) ខណៈពេលដែលការកែតម្រូវបង្កើនភាពពាក់ព័ន្ធ និងស្ថិរភាពនៃលទ្ធផល។ រួមបញ្ចូលគ្នា, អនុញ្ញាតឱ្យមានចំណុចប្រទាក់មានប្រយោជន៍ លឿនជាងមុន និងអាចទុកចិត្តបាន។.

វិស្វកម្មភ្លាមៗនៅក្នុងជម្រៅ: បច្ចេកទេសដែលផ្លាស់ទីម្ជុល
វិស្វកម្មភ្លាមៗមិនមែននិយាយអំពីការធ្វើតេស្តពិការភ្នែកទេ។ មាន វិធីសាស្រ្តជាប្រព័ន្ធ ដែលធ្វើឲ្យគុណភាពប្រសើរឡើងដោយមិនប៉ះម៉ូដែល ឬទិន្នន័យមូលដ្ឋានរបស់អ្នក៖
- បាញ់តិចទល់នឹងសូន្យ។ en បាញ់ពីរបី អ្នកបន្ថែមឧទាហរណ៍មួយចំនួនដែលបានជ្រើសរើសយ៉ាងល្អដើម្បីឱ្យគំរូចាប់យកគំរូពិតប្រាកដ។ នៅក្នុង សូន្យបាញ់ អ្នកពឹងផ្អែកលើការណែនាំច្បាស់លាស់ និងការចាត់ថ្នាក់ដោយគ្មានឧទាហរណ៍។
- បាតុកម្មក្នុងបរិបទ. បង្ហាញទម្រង់ដែលរំពឹងទុក (បញ្ចូល → ទិន្នផល) ជាមួយគូតូច។ វាកាត់បន្ថយកំហុសក្នុងទម្រង់ និងតម្រឹមការរំពឹងទុក ជាពិសេសប្រសិនបើអ្នកត្រូវការវាល ស្លាក ឬរចនាប័ទ្មជាក់លាក់ក្នុងការឆ្លើយតប។
- គំរូ និងអថេរកំណត់ការជម្រុញជាមួយកន្លែងដាក់សម្រាប់ការផ្លាស់ប្តូរទិន្នន័យ។ ការជម្រុញថាមវន្តគឺជាគន្លឹះនៅពេលដែលរចនាសម្ព័ន្ធបញ្ចូលប្រែប្រួល ជាឧទាហរណ៍ នៅក្នុងការសម្អាតទិន្នន័យ ឬសំណល់អេតចាយដែលកំណត់ត្រានីមួយៗមកដល់ក្នុងទម្រង់ផ្សេងគ្នា។
- ពាក្យសំដីពួកគេគឺជា "អ្នកបកប្រែ" រវាងចន្លោះអត្ថបទនៃគំរូ និងប្រភេទអាជីវកម្មរបស់អ្នក (ឧ. គូសផែនទី "រីករាយ" → "វិជ្ជមាន")។ ការជ្រើសរើសពាក្យសំដីល្អ ធ្វើអោយប្រសើរឡើងនូវភាពត្រឹមត្រូវនៃស្លាកសញ្ញា និងភាពស៊ីសង្វាក់គ្នា ជាពិសេសនៅក្នុងការវិភាគមនោសញ្ចេតនា និងការចាត់ថ្នាក់តាមប្រធានបទ។
- ខ្សែអក្សរជម្រុញ (ខ្សែសង្វាក់ភ្លាមៗ) ។ បំបែកកិច្ចការស្មុគ្រស្មាញជាជំហានៗ៖ សង្ខេប → ស្រង់ចេញម៉ែត្រ → វិភាគមនោសញ្ចេតនា។ ជំហានខ្សែសង្វាក់រួមគ្នាធ្វើឱ្យប្រព័ន្ធកាន់តែបំបាត់កំហុស និងរឹងមាំ ហើយជារឿយៗធ្វើអោយគុណភាពប្រសើរឡើងបើប្រៀបធៀបទៅនឹង "ការស្នើសុំអ្វីៗទាំងអស់ក្នុងពេលតែមួយ"។
- ការអនុវត្តទម្រង់ល្អ។: សម្គាល់តួនាទី (“អ្នកគឺជាអ្នកវិភាគ…”) កំណត់រចនាប័ទ្ម (“ឆ្លើយតបក្នុងតារាង/JSON”) បង្កើតលក្ខណៈវិនិច្ឆ័យវាយតម្លៃ (“ដាក់ទោសភាពស្រឡាំងកាំង ដកស្រង់ប្រភពនៅពេលមាន”) និងពន្យល់ពីអ្វីដែលត្រូវធ្វើក្នុងករណីមានភាពមិនច្បាស់លាស់ (ឧ. “ប្រសិនបើទិន្នន័យបាត់ សូមចង្អុលបង្ហាញថា 'មិនស្គាល់')។
សមាសធាតុលៃតម្រូវភ្លាមៗ
បន្ថែមពីលើការបំផុសគំនិតធម្មជាតិ ការលៃតម្រូវភ្លាមៗរួមបញ្ចូលការជម្រុញទន់ (ការបង្កប់ដែលអាចបណ្តុះបណ្តាលបាន) ដែលនាំមុខការបញ្ចូល។ កំឡុងពេលហ្វឹកហាត់ ជម្រាលនឹងកែតម្រូវវ៉ិចទ័រទាំងនោះ ដើម្បីនាំទិន្នផលខិតទៅជិតគោលដៅ។ ដោយមិនប៉ះពាល់ដល់ទម្ងន់ផ្សេងទៀតរបស់ម៉ូដែល។ វាមានប្រយោជន៍នៅពេលអ្នកចង់បានការចល័ត និងការចំណាយទាប។
អ្នកបង្ហោះ LLM (ឧទាហរណ៍ GPT‑2 ឬស្រដៀងគ្នា) រៀបចំឧទាហរណ៍របស់អ្នក និង អ្នករៀបចំការជម្រុញទន់សម្រាប់ការចូលនីមួយៗអ្នកបណ្តុះបណ្តាលតែការបង្កប់ទាំងនោះ ដូច្នេះគំរូ "មើលឃើញ" បុព្វបទដែលបានធ្វើឱ្យប្រសើរដែលណែនាំអាកប្បកិរិយារបស់វានៅក្នុងកិច្ចការរបស់អ្នក។
ការអនុវត្តជាក់ស្តែង៖ នៅក្នុង chatbot សេវាកម្មអតិថិជន អ្នកអាចរួមបញ្ចូលគំរូសំណួរធម្មតា និងសម្លេងឆ្លើយតបដ៏ល្អនៅក្នុងការជម្រុញទន់។ នេះបង្កើនល្បឿននៃការសម្របខ្លួនដោយមិនរក្សាសាខាផ្សេងគ្នានៃម៉ូដែល។ ឬប្រើប្រាស់ GPU បន្ថែមទៀត។

ការកែសំរួលស៊ីជម្រៅ៖ ពេលណា របៀប និងដោយប្រុងប្រយ័ត្ន
ការលៃតម្រូវការកែតម្រូវឡើងវិញ (ដោយផ្នែកឬទាំងស្រុង) ទម្ងន់នៃ LLM ជាមួយនឹងសំណុំទិន្នន័យគោលដៅ។ ដើម្បីឯកទេសវា។ នេះគឺជាវិធីសាស្រ្តដ៏ល្អបំផុត នៅពេលដែលកិច្ចការខុសពីអ្វីដែលគំរូបានឃើញក្នុងអំឡុងពេលបណ្តុះបណ្តាលមុន ឬត្រូវការវាក្យស័ព្ទ និងការសម្រេចចិត្តដ៏ល្អិតល្អន់។
អ្នកមិនចាប់ផ្តើមពីផ្ទាំងថ្មទទេទេ។៖ ម៉ូដែលដែលអាចជជែកបានដូចជា gpt-3.5-turbo ពួកគេត្រូវបានសម្រួលរួចហើយ ដើម្បីធ្វើតាមការណែនាំ។ ការលៃតម្រូវដ៏ល្អរបស់អ្នក "ឆ្លើយតប" ទៅនឹងអាកប្បកិរិយានោះ។ដែលអាចមានភាពស្រពិចស្រពិល និងមិនច្បាស់លាស់ ដូច្នេះវាជាការប្រសើរក្នុងការពិសោធន៍ជាមួយនឹងការរចនានៃប្រអប់បញ្ចូល និងការបញ្ចូលប្រព័ន្ធ។
វេទិកាមួយចំនួនអនុញ្ញាតឱ្យអ្នកដាក់ខ្សែសង្វាក់បទភ្លេងដ៏ល្អជាងឧបករណ៍ដែលមានស្រាប់។ នេះពង្រឹងសញ្ញាមានប្រយោជន៍ក្នុងតម្លៃទាប។ ដើម្បីបង្ហាត់ពីដំបូង និងសម្របសម្រួលការបញ្ជាក់ឡើងវិញដែលណែនាំដោយសុពលភាព។
បច្ចេកទេសដ៏មានប្រសិទ្ធភាពដូចជា LoRA បញ្ចូលម៉ាទ្រីសកម្រិតទាបដើម្បីសម្របគំរូជាមួយនឹងប៉ារ៉ាម៉ែត្រថ្មីមួយចំនួន។ គុណសម្បត្តិ៖ ការប្រើប្រាស់ទាប ការដាក់ពង្រាយរហ័ស និងអាចបញ្ច្រាស់បាន។ (អ្នកអាច "យកចេញ" ការសម្របខ្លួនដោយមិនប៉ះមូលដ្ឋាន) ។

ការប្រៀបធៀប៖ ការលៃតម្រូវរហ័សធៀបនឹងការលៃតម្រូវការផាកពិន័យ
- Procesoការលៃតម្រូវការធ្វើឱ្យទាន់សម័យទម្ងន់គំរូជាមួយនឹងសំណុំទិន្នន័យគោលដៅដែលមានស្លាក។ ការលៃតម្រូវភ្លាមៗធ្វើឱ្យម៉ូដែលបង្កក និងកែសម្រួលតែការបង្កប់ដែលអាចហ្វឹកហាត់បានដែលត្រូវបានភ្ជាប់ជាមួយការបញ្ចូល។ វិស្វកម្មរហ័សធ្វើឱ្យអត្ថបទណែនាំ និងឧទាហរណ៍ដែលមិនបានទទួលការបណ្តុះបណ្តាល។
- ការកំណត់ប៉ារ៉ាម៉ែត្រនៅក្នុងការលៃតម្រូវ, អ្នកកែប្រែបណ្តាញ; នៅក្នុងការលៃតម្រូវភ្លាមៗអ្នកគ្រាន់តែប៉ះ "ការជម្រុញឱ្យទន់" ។ នៅក្នុងវិស្វកម្មភ្លាមៗ មិនមានការលៃតម្រូវប៉ារ៉ាម៉ែត្រទេ គ្រាន់តែជាការរចនាប៉ុណ្ណោះ។
- ទ្រង់ទ្រាយបញ្ចូលការលៃតម្រូវល្អជាធម្មតាគោរពទម្រង់ដើម។ ការលៃតម្រូវភ្លាមៗ កែទម្រង់ការបញ្ចូលជាមួយការបង្កប់ និងគំរូ។ វិស្វកម្មរហ័សប្រើភាសាធម្មជាតិដែលមានរចនាសម្ព័ន្ធ (តួនាទី ឧបសគ្គ ឧទាហរណ៍)។
- ធនធានការលៃតម្រូវល្អមានតម្លៃថ្លៃជាង (ការគណនាទិន្នន័យនិងពេលវេលា); ការលៃតម្រូវភ្លាមៗមានប្រសិទ្ធភាពជាង; វិស្វកម្មភ្លាមៗគឺជាតម្លៃថោកបំផុត និងលឿនបំផុតក្នុងការធ្វើម្តងទៀត ប្រសិនបើករណីអនុញ្ញាត។
- គោលបំណង និងហានិភ័យការលៃតម្រូវការកែលម្អធ្វើឱ្យប្រសើរដោយផ្ទាល់ទៅនឹងភារកិច្ច, លុបបំបាត់ហានិភ័យនៃការលើសទម្ងន់; ការលៃតម្រូវភ្លាមៗត្រូវនឹងអ្វីដែលបានរៀនរួចហើយនៅក្នុង LLM ។ វិស្វកម្មភ្លាមៗកាត់បន្ថយការយល់ច្រលំ និងកំហុសក្នុងការធ្វើទ្រង់ទ្រាយ ជាមួយនឹងការអនុវត្តល្អបំផុតដោយមិនប៉ះគំរូ។
ទិន្នន័យ និងឧបករណ៍៖ ឥន្ធនៈនៃការអនុវត្ត
- គុណភាពទិន្នន័យដំបូង: ការព្យាបាល, ការដកស្ទួន, តុល្យភាព, ការគ្របដណ្តប់ករណីគែម និង ទិន្នន័យមេតាសម្បូរបែប វាជាលទ្ធផល 80% មិនថាអ្នកធ្វើការកែតម្រូវ ឬកែតម្រូវភ្លាមៗនោះទេ។
- ស្វ័យប្រវត្តិកម្មបំពង់៖ វេទិកាវិស្វកម្មទិន្នន័យសម្រាប់ AI បង្កើត (ឧ. ដំណោះស្រាយដែលបង្កើតផលិតផលទិន្នន័យដែលអាចប្រើឡើងវិញបាន) ជួយរួមបញ្ចូល បំប្លែង ចែកចាយ និងត្រួតពិនិត្យសំណុំទិន្នន័យ សម្រាប់ការបណ្តុះបណ្តាល និងការវាយតម្លៃ។ គោលគំនិតដូចជា "Nexsets" បង្ហាញពីរបៀបវេចខ្ចប់ទិន្នន័យរួចរាល់សម្រាប់ការប្រើប្រាស់គំរូ។
- រង្វិលជុំមតិ៖ ប្រមូលសញ្ញានៃការប្រើប្រាស់ពិភពលោកពិតប្រាកដ (ជោគជ័យ កំហុស សំណួរដែលគេសួរញឹកញាប់) ហើយបញ្ជូនវាត្រឡប់ទៅក្នុងប្រអប់បញ្ចូល សំណើទន់ ឬសំណុំទិន្នន័យរបស់អ្នក។ វាជាវិធីលឿនបំផុតដើម្បីទទួលបានភាពត្រឹមត្រូវ។
- ការបន្តពូជ៖ កំណែប្រអប់បញ្ចូល ការជម្រុញទន់ ទិន្នន័យ និងទម្ងន់ដែលបានកំណត់។ បើគ្មានការតាមដានទេ វាមិនអាចទៅរួចទេក្នុងការដឹងពីអ្វីដែលបានផ្លាស់ប្តូរការអនុវត្ត ឬត្រឡប់ទៅស្ថានភាពល្អវិញ ប្រសិនបើការកើតឡើងម្តងទៀតបរាជ័យ។
- ទូទៅនៅពេលពង្រីកកិច្ចការ ឬភាសា ត្រូវប្រាកដថា ពាក្យសំដី គំរូ និងស្លាករបស់អ្នកមិនត្រូវបានគេកែសម្រួលខ្លាំងពេកទៅនឹងដែនជាក់លាក់មួយ។ ប្រសិនបើអ្នកកំពុងផ្លាស់ប្តូរបញ្ឈរ អ្នកប្រហែលជាត្រូវធ្វើការកែតម្រូវពន្លឺមួយចំនួន ឬប្រើការជម្រុញទន់ថ្មី។
- ចុះបើខ្ញុំប្ដូរសារបន្ទាប់ពីការកែសម្រួល? ជាទូទៅ បាទ/ចាស៖ គំរូគួរតែសន្និដ្ឋានអំពីរចនាប័ទ្ម និងអាកប្បកិរិយាពីអ្វីដែលវាបានរៀន មិនមែនគ្រាន់តែនិយាយឡើងវិញនូវសញ្ញាសម្ងាត់នោះទេ។ នោះជាចំណុចនៃម៉ាស៊ីនសន្និដ្ឋានយ៉ាងជាក់លាក់។
- បិទរង្វិលជុំជាមួយម៉ែត្រលើសពីភាពត្រឹមត្រូវ វាវាស់ទម្រង់ត្រឹមត្រូវ ការគ្របដណ្តប់ ការដកស្រង់ប្រភពនៅក្នុង RAG និងការពេញចិត្តរបស់អ្នកប្រើប្រាស់។ អ្វីដែលមិនត្រូវបានវាស់វែងមិនប្រសើរឡើងទេ។
ការជ្រើសរើសរវាងការជំរុញ ការសម្រួលរហ័ស និងការសម្រួលមិនមែនជាបញ្ហានៃគោលលទ្ធិទេ ប៉ុន្តែជាបរិបទ។៖ ការចំណាយ មាត្រដ្ឋានពេលវេលា ហានិភ័យនៃកំហុស ភាពអាចរកបាននៃទិន្នន័យ និងតម្រូវការសម្រាប់អ្នកជំនាញ។ ប្រសិនបើអ្នកកំណត់កត្តាទាំងនេះ បច្ចេកវិទ្យានឹងដំណើរការតាមការពេញចិត្តរបស់អ្នក មិនមែនវិធីផ្សេងនោះទេ។
កម្មវិធីនិពន្ធដែលមានឯកទេសខាងបច្ចេកវិទ្យា និងបញ្ហាអ៊ីនធឺណិតដែលមានបទពិសោធន៍ជាងដប់ឆ្នាំនៅក្នុងប្រព័ន្ធផ្សព្វផ្សាយឌីជីថលផ្សេងៗគ្នា។ ខ្ញុំបានធ្វើការជាអ្នកកែសម្រួល និងអ្នកបង្កើតមាតិកាសម្រាប់ពាណិជ្ជកម្មអេឡិចត្រូនិក ការទំនាក់ទំនង ទីផ្សារអនឡាញ និងក្រុមហ៊ុនផ្សាយពាណិជ្ជកម្ម។ ខ្ញុំក៏បានសរសេរនៅលើគេហទំព័រ សេដ្ឋកិច្ច ហិរញ្ញវត្ថុ និងវិស័យផ្សេងៗទៀត។ ការងាររបស់ខ្ញុំក៏ជាចំណង់ចំណូលចិត្តរបស់ខ្ញុំដែរ។ ឥឡូវនេះតាមរយៈអត្ថបទរបស់ខ្ញុំនៅក្នុង Tecnobitsខ្ញុំព្យាយាមស្វែងរកព័ត៌មាន និងឱកាសថ្មីៗទាំងអស់ ដែលពិភពបច្ចេកវិទ្យាផ្តល់ជូនយើងជារៀងរាល់ថ្ងៃ ដើម្បីកែលម្អជីវិតរបស់យើង។