របៀបដំឡើង Gemma 3 LLM នៅលើ Windows 11 មួយជំហានម្តងៗ

បច្ចុប្បន្នភាពចុងក្រោយ៖ 02/04/2025
អ្នកនិពន្ធ: Alberto navarro

  • Gemma 3 គឺជាគំរូ LLM ពហុម៉ូឌុលដែលអាចបត់បែនបានខ្ពស់ដែលត្រូវបានបង្កើតឡើងដោយ Google
  • វាអាចត្រូវបានដំឡើងនៅលើ Windows 11 ដោយប្រើ Ollama, LM Studio ឬប្រើតាមរយៈ Google AI Studio
  • ទាមទារធនធានអថេរអាស្រ័យលើទំហំនៃម៉ូដែល ពី 8 GB ទៅ 32 GB នៃ RAM
  • រួមបញ្ចូលមុខងារកម្រិតខ្ពស់ដូចជាការបញ្ចូលរូបភាព និងនិមិត្តសញ្ញាបរិបទរហូតដល់ 128k
របៀបដំឡើង Gemma 3 LLM នៅលើ Windows 11/8

គំរូភាសាប្រភពបើកចំហបានវិវត្តដោយការលោតផ្លោះ និងព្រំដែន និង សព្វថ្ងៃនេះវាអាចទៅរួចក្នុងការរីករាយជាមួយពួកគេដោយផ្ទាល់ពីកុំព្យូទ័រផ្ទាល់ខ្លួនដោយមិនអាស្រ័យលើសេវាកម្មពពក។. មួយក្នុងចំណោមការសន្យាបំផុតនាពេលបច្ចុប្បន្នគឺ Gemma 3 ដែលជា LLM ថ្មីរបស់ Google ផ្អែកលើបច្ចេកវិទ្យា Gemini ដែលលេចធ្លោសម្រាប់សមត្ថភាពរបស់វាក្នុងការដំណើរការអត្ថបទ និងរូបភាព ក៏ដូចជាសម្រាប់បង្អួចបរិបទដ៏ធំរបស់វារហូតដល់ 128k tokens នៅក្នុងកំណែកម្រិតខ្ពស់របស់វា។ សម្រាប់ព័ត៌មានបន្ថែមអំពីការចេញផ្សាយនេះ អ្នកអាចចូលមើលអត្ថបទរបស់យើងនៅលើ បទបង្ហាញរបស់ Gemma 3.

ប្រសិនបើអ្នកកំពុងប្រើ Windows 11 ហើយចង់ដំឡើង Gemma 3 សម្រាប់ការពិសោធន៍ ឬសូម្បីតែការផលិតក្នុងស្រុកអ្នកបានមកដល់កន្លែងដែលត្រឹមត្រូវ។ ចូរនិយាយលម្អិតអំពីវិធីដែលអាចធ្វើបានទាំងអស់ដើម្បីធ្វើឱ្យវាដំណើរការនៅលើកុំព្យូទ័ររបស់អ្នក រួមទាំងជម្រើសដែលបានណែនាំបំផុតដូចជា Ollama, LM Studio និងជម្រើសផ្អែកលើពពកជាមួយ Google AI Studio ផងដែរ។ លើសពីនេះទៀតយើងនឹងដោះស្រាយតម្រូវការបច្ចេកទេសគុណសម្បត្តិនៃវិធីសាស្រ្តនីមួយៗនិង តើធ្វើដូចម្តេចដើម្បីធ្វើឱ្យភាគច្រើនបំផុតនៃសក្តានុពលនៃបញ្ញាសិប្បនិម្មិតដ៏មានឥទ្ធិពលនេះ។.

តើ Gemma 3 ជាអ្វី ហើយហេតុអ្វីត្រូវដំឡើងវា?

Google បើកដំណើរការ Gemma 3-4

Gemma 3 គឺជាជំនាន់ទីបីនៃម៉ូដែល LLM ដែលចេញដោយ Google ក្រោមអាជ្ញាប័ណ្ណប្រភពបើកចំហ។. មិនដូចដំណោះស្រាយពីមុនដូចជា Llama ឬ Mistral ទេ វាផ្តល់នូវការគាំទ្រដោយផ្ទាល់សម្រាប់ការបញ្ចូលរូបភាព បរិបទកាន់តែទូលំទូលាយ និងការគាំទ្រជាង 140 ភាសា។ អាស្រ័យលើតម្រូវការរបស់អ្នក អ្នកអាចជ្រើសរើសពីកំណែជាច្រើននៃគំរូចាប់ពីប៉ារ៉ាម៉ែត្រ 1B ដល់ 27B៖

  • ហ្គេម៉ា 3:1B៖ គំរូទម្ងន់ស្រាលល្អសម្រាប់កិច្ចការមូលដ្ឋាន និងបរិស្ថានដែលមានកម្រិតធនធាន។
  • ហ្គេម៉ា 3:4B៖ តុល្យភាពនៃការអនុវត្ត និងប្រសិទ្ធភាពសម្រាប់កម្មវិធីកម្រិតមធ្យម។
  • ហ្គេម៉ា 3:12B៖ ត្រូវបានណែនាំសម្រាប់ការវិភាគស្មុគស្មាញ ការសរសេរកម្មវិធី និងដំណើរការពហុភាសា។
  • ហ្គេម៉ា 3:27B៖ ជាជម្រើសដ៏មានឥទ្ធិពលបំផុត ដែលត្រូវបានរចនាឡើងសម្រាប់ការប្រើប្រាស់ច្រើនបែបដែលពឹងផ្អែកខ្លាំង ជាមួយនឹងសមត្ថភាពបរិបទដ៏អស្ចារ្យ។
មាតិកាផ្តាច់មុខ - ចុចទីនេះ  តើធ្វើដូចម្តេចដើម្បីដកប្រាក់នៅក្នុង Sweatcoin?

លទ្ធភាពនៃការដំណើរការម៉ូដែលកម្រិតខ្ពស់បែបនេះពីកុំព្យូទ័ររបស់អ្នក។ វាផ្លាស់ប្តូរច្បាប់នៃហ្គេមទាក់ទងនឹងភាពឯកជន ល្បឿនឆ្លើយតប និងការពឹងផ្អែកលើភាគីទីបី។ អ្នកមិនចាំបាច់បង់ថ្លៃជាវប្រចាំខែ ឬបោះបង់ទិន្នន័យរបស់អ្នកទៀតទេ។ អ្វី​ដែល​វា​ត្រូវ​ការ​គឺ​ការ​ត្រៀម​ខ្លួន​បន្តិច​បន្តួច​និង​ការ​ចង់​រៀន​។ ប្រសិនបើអ្នកចង់ដឹងបន្ថែមអំពីអត្ថប្រយោជន៍នៃម៉ូដែលទាំងនេះសូមមើលអត្ថបទរបស់យើងនៅលើ ម៉ូដែល AI ទម្ងន់បើកចំហ.

ជម្រើសទី 1: ការដំឡើងជាមួយ Ollama

ទាញយក Ollama

Ollama គឺប្រហែលជាវិធីងាយស្រួលបំផុតដើម្បីដំណើរការ LLM ដូចជា Gemma 3 ពី Windows 11. ចំណុចប្រទាក់ដែលមានមូលដ្ឋានលើស្ថានីយរបស់វាអនុញ្ញាតឱ្យអ្នកដំឡើង និងដំណើរការម៉ូដែលជាមួយនឹងបន្ទាត់ពាក្យបញ្ជាសាមញ្ញ។ លើសពីនេះ វាអាចប្រើបានជាមួយ macOS, Linux និង Windows ដែលធ្វើឱ្យវាងាយស្រួលប្រើក្នុងបរិយាកាសផ្សេងៗគ្នា។

ជំហានដើម្បីដំឡើង Ollama និងដំណើរការ Gemma 3:

  1. ចូលទៅកាន់គេហទំព័រផ្លូវការ៖ ollama.com.
  2. ទាញយកកម្មវិធីដំឡើងសម្រាប់វីនដូ ហើយដំណើរការវាដូចកម្មវិធីផ្សេងទៀតដែរ។
  3. បើក Command Prompt (CMD) ឬ PowerShell ហើយផ្ទៀងផ្ទាត់ការដំឡើងជាមួយ៖
ollama --version

ប្រសិនបើអ្វីៗដំណើរការល្អ ឥឡូវនេះអ្នកអាចទាញយកគំរូ Gemma 3 ណាមួយដែលមាន។ គ្រាន់តែដំណើរការពាក្យបញ្ជាមួយក្នុងចំណោមពាក្យបញ្ជាទាំងនេះ អាស្រ័យលើគំរូដែលអ្នកចង់បាន៖

ollama run gemma3:1b
ollama run gemma3:4b
ollama run gemma3:12b
ollama run gemma3:27b

នៅពេលទាញយករួច អ្នកអាចចាប់ផ្តើមម៉ូដែលបានយ៉ាងងាយស្រួល។. ដើម្បីធ្វើដូចនេះរត់៖

ollama init gemma3

ចាប់ពីពេលនោះមក អ្នកអាចចាប់ផ្តើមធ្វើអន្តរកម្មជាមួយ LLM ដោយ៖

ollama query gemma3 "¿Cuál es la capital de Japón?"

ប្រសិនបើអ្នកចង់ទាញយកអត្ថប្រយោជន៍ពីមុខងារពហុមុខងារអ្នកក៏អាចប្រើរូបភាពក្នុងសំណួររបស់អ្នកផងដែរ៖

ollama query gemma3 --image "ruta-de-la-imagen.jpg"

តើអ្នកត្រូវការអ្វីខ្លះដើម្បីធ្វើឱ្យវាដំណើរការល្អ? ទោះបីជា Ollama មិនកំណត់តម្រូវការអប្បបរមាយ៉ាងតឹងរឹងក៏ដោយ ម៉ូដែលធំ (ដូចជា 27B) ត្រូវការ RAM យ៉ាងហោចណាស់ 32GB។ ជាមួយនឹងទំហំ 16GB អ្នកអាចធ្វើការដោយគ្មានបញ្ហាជាមួយនឹងម៉ូដែល 7B ហើយទោះបីជាការប្រើប្រាស់ GPU មិនតម្រូវក៏ដោយ វាជួយបានច្រើនក្នុងល្បឿន។

មាតិកាផ្តាច់មុខ - ចុចទីនេះ  របៀបបង្កើតការសរសេរតាមសំឡេងដោយប្រើក្តារចុច 1C?

ជម្រើសទី 2៖ ប្រើ LM Studio

LM Studio

LM Studio គឺជាឧបករណ៍ឥតគិតថ្លៃមួយផ្សេងទៀតដែលអនុញ្ញាតឱ្យអ្នកដំឡើង និងដំណើរការម៉ូដែល LLM ក្នុងស្រុកពីចំណុចប្រទាក់ក្រាហ្វិក។. វាអាចប្រើបានជាមួយ Windows, macOS និង Linux ហើយអត្ថប្រយោជន៍ដ៏អស្ចារ្យរបស់វាគឺថាវាមិនទាមទារចំណេះដឹងបច្ចេកទេសដើម្បីដំណើរការនោះទេ។

សេចក្តីណែនាំ:

  1. ទាញយក LM Studio ពីគេហទំព័រផ្លូវការរបស់វា៖ lmstudio.ai.
  2. ដំឡើងនិងដំណើរការវា។
  3. ចុចលើរូបតំណាងកែវពង្រីកដែលនិយាយថា "ស្វែងយល់" ។
  4. វាយ "Gemma 3" ទៅក្នុងម៉ាស៊ីនស្វែងរក ដើម្បីមើលម៉ូដែលដែលមាន។

មុនពេលដំឡើង សូមពិនិត្យមើលថាតើម៉ូដែលនេះត្រូវគ្នាជាមួយឧបករណ៍របស់អ្នកដែរឬទេ. ប្រសិនបើអ្នកឃើញការព្រមាន "ទំនងជាធំពេកសម្រាប់ម៉ាស៊ីននេះ" អ្នកនៅតែអាចដំឡើងវាបាន ប៉ុន្តែដំណើរការល្អបំផុតមិនត្រូវបានធានាទេ។

នៅពេលដែលគំរូដែលត្រូវគ្នាត្រូវបានទាញយក៖

  • ចុច "Load Model" ដើម្បីផ្ទុកវា។
  • ឬបើកការជជែកថ្មី ហើយជ្រើសរើសម៉ូដែលពីម៉ឺនុយទម្លាក់ចុះ។

អ្វីដែលល្អបំផុតអំពី LM Studio គឺថាវាដើរតួជាប្រភេទ ChatGPT ក្នុងស្រុក ក្រៅបណ្តាញ និងជាភាសារបស់អ្នក។. អ្នកអាចបង្កើតការជជែកច្រើន និងរក្សាទុកការសន្ទនារបស់អ្នកប្រសិនបើអ្នកចង់បាន។ លើសពីនេះទៀត ប្រសិនបើអ្នកបើកជម្រើស "Local Server" អ្នកអាចបញ្ចូលវាជាមួយកម្មវិធី Python របស់អ្នកដោយប្រើ OpenAI-compatible API។

ជម្រើសទី 3៖ ប្រើ Google AI Studio (អនឡាញ)

Google AI Studio

ប្រសិនបើអ្នកមិនអាច ឬមិនចង់ដំឡើងអ្វីទាំងអស់ អ្នកអាចប្រើ Gemma 3 ដោយផ្ទាល់ពីពពកជាមួយ Google AI Studio. មិនចាំបាច់ដំឡើងទេ ប៉ុន្តែការភ្ជាប់អ៊ីនធឺណិត និងគណនី Google ត្រូវបានទាមទារ។

អ្នកគ្រាន់តែត្រូវទៅ aistudio.google.com ហើយជ្រើសរើស "Gemma 3" ពីបញ្ជីគំរូ។ ចាប់ពីពេលនោះមក អ្នកអាចចាប់ផ្តើមជជែកជាមួយម៉ូដែលដូចជាប្រសិនបើវាជាកំណែកម្រិតខ្ពស់នៃ Bard ឬ ChatGPT រួមទាំងការបញ្ចូលរូបភាពផងដែរ។

ការដំឡើងពពកជាមួយ NodeShift (ជាជម្រើស)

សម្រាប់អ្នកដែលកំពុងស្វែងរកថាមពលបន្ថែម ឬដើម្បីដាក់ពង្រាយម៉ូដែលប្រកបដោយវិជ្ជាជីវៈមានជម្រើសនៃការប្រើប្រាស់សេវាកម្មពពកដូចជា NodeShift ។ ជាមួយពួកគេ អ្នកអាចជួលម៉ាស៊ីនដែលមាន GPU ដ៏មានអានុភាព និងកំណត់រចនាសម្ព័ន្ធបរិយាកាសដ៏ល្អរបស់អ្នកដើម្បីដំណើរការ Gemma 3 ដោយគ្មានដែនកំណត់។

មាតិកាផ្តាច់មុខ - ចុចទីនេះ  តើស្ថិតិដំណើរការត្រូវបានតាមដានដោយកម្មវិធី Nike Run Club យ៉ាងដូចម្តេច?

ជំហានជាមូលដ្ឋាននៅក្នុង NodeShift៖

  1. បង្កើតគណនីនៅ app.nodeshift.com.
  2. ចាប់ផ្តើមថ្នាំង GPU ផ្ទាល់ខ្លួន (ឧ. ជាមួយ 2x RTX 4090)។
  3. ជ្រើសរើសរូបភាពដែលបានកំណត់ជាមុនជាមួយ Ubuntu + Nvidia CUDA ឬ Jupyter Notebook អាស្រ័យលើថាតើអ្នកនឹងប្រើ Ollama ឬ Transformers ដែរឬទេ។
  4. ភ្ជាប់តាមរយៈ SSH ហើយដំឡើងគំរូពីបន្ទាត់ពាក្យបញ្ជា។

ប្រភេទនៃការដំឡើងនេះផ្តល់ឱ្យអ្នកនូវការចូលទៅកាន់ការកំណត់រចនាសម្ព័ន្ធវិជ្ជាជីវៈល្អបំផុតសម្រាប់ម៉ូដែលបណ្ដុះបណ្ដាល ការវាយតម្លៃការអនុវត្ត។

តម្រូវការប្រព័ន្ធ និងអនុសាសន៍បច្ចេកទេស

មិនមែនគ្រប់ម៉ូដែល Gemma 3 ទាំងអស់នឹងដំណើរការលើកុំព្យូទ័រណាមួយនោះទេ។. ខាង​ក្រោម​នេះ​យើង​ទុក​ឱ្យ​អ្នក​នូវ​ឯកសារ​យោង​ទូទៅ​តាម​ប្រភេទ​នៃ​ម៉ូដែល៖

  • para ម៉ូដែល 1B ដល់ 7B៖ អប្បបរមា សតិ 8 ជីកាបៃ. ពួកគេធ្វើការលើកុំព្យូទ័រទំនើបស្ទើរតែទាំងអស់ ទោះបីជាមិនមាន GPU ក៏ដោយ។
  • para ម៉ូដែល 13B៖ ត្រូវបានណែនាំ RAM ទំហំ 16GB ទៅ 24GB.
  • para ម៉ូដែល 27B៖ ត្រូវការ យ៉ាងហោចណាស់មាន RAM ៤ ជីកាបៃ និងនិយម GPU ពិសេស។

ការមាន RAM កាន់តែច្រើនបង្កើនល្បឿនប្រតិបត្តិការ និងការពារកំហុសដោយសារកង្វះអង្គចងចាំ. ខណៈពេលដែល Ollama និង LM Studio ព្យាយាមប្រើប្រាស់ធនធានប្រកបដោយប្រសិទ្ធភាព វានឹងពឹងផ្អែកច្រើនលើផ្នែករឹងរបស់អ្នក។ លើសពីនេះ ល្បឿនឆ្លើយតបនឹងប្រសើរឡើងយ៉ាងខ្លាំង ប្រសិនបើ GPU ត្រូវបានប្រើជំនួសស៊ីភីយូ។

ការដំឡើង Gemma 3 នៅលើ Windows 11 គឺងាយស្រួលជាងវាហាក់ដូចជា។. វាមិនមានបញ្ហាទេប្រសិនបើអ្នកសម្រេចចិត្តប្រើ Ollama សម្រាប់ភាពសាមញ្ញរបស់វា LM Studio សម្រាប់ចំណុចប្រទាក់ក្រាហ្វិករបស់វា ឬ Google AI Studio ដើម្បីលេងវាដោយសុវត្ថិភាពក្នុងពពក។ រឿងសំខាន់គឺថាវិធីសាស្រ្តនីមួយៗសម្របខ្លួនទៅនឹងកម្រិតផ្សេងៗគ្នានៃបទពិសោធន៍និងសមត្ថភាពបច្ចេកទេស។ ឥឡូវនេះអ្នកដឹងពីជម្រើសទាំងអស់ និងអ្វីដែលអ្នកត្រូវការដើម្បីចាប់ផ្តើម អ្នកអាចចាប់ផ្តើមពិសោធន៍ជាមួយនឹងបញ្ញាសិប្បនិម្មិតក្នុងស្រុកដ៏គួរឱ្យចាប់អារម្មណ៍នេះនៅថ្ងៃនេះ។