ວິທີການຕິດຕັ້ງ Microsoft Phi-4 Multimodal ໃນ Windows 11

ອັບເດດຫຼ້າສຸດ: 02/03/2025

Phi-4 Multimodal

ສອງ ສາມ ມື້ ກ່ອນ ຫນ້າ ນີ້ ໃນ blog ນີ້ ພວກ ເຮົາ echoed ການ ເປີດ ຕົວ ຂອງ Microsoft Phi-4 Multimodal, ຮູບແບບປັນຍາປະດິດທີ່ມີຄວາມທະເຍີທະຍານທີ່ຖືກອອກແບບມາເພື່ອປະມວນຜົນຂໍ້ຄວາມ, ຮູບພາບແລະສຽງໃນເວລາດຽວກັນ. ບາດກ້າວບຸກທະລຸທີ່ສະແດງເຖິງ ກ ຈຸດໝາຍສຳຄັນ ໃນ​ວິ​ວັດ​ການ​ຂອງ AI ໄດ້​, ເຮັດໃຫ້ການໂຕ້ຕອບທໍາມະຊາດແລະປະສິດທິພາບຫຼາຍຂຶ້ນກັບອຸປະກອນ. ຕອນນີ້ໃຫ້ເຮົາເບິ່ງ ວິທີການຕິດຕັ້ງ Phi-4 Multimodal ໃນ Windows 11 ແລະເລີ່ມເພີດເພີນກັບຂໍ້ໄດ້ປຽບຂອງມັນ.

ຂໍ້ມູນທີ່ພວກເຮົານໍາມາໃຫ້ທ່ານໃນບົດຄວາມນີ້ຈະເປັນປະໂຫຍດຫຼາຍເພື່ອໃຊ້ປະໂຫຍດຈາກພະລັງງານທີ່ຍິ່ງໃຫຍ່ຂອງ AI ນີ້. ທີ່ນີ້ເຈົ້າຈະພົບເຫັນລາຍລະອຽດຂັ້ນຕອນການຕິດຕັ້ງໂດຍຂັ້ນຕອນ, ຈາກຄວາມຕ້ອງການຕໍາ່ສຸດທີ່ກັບການຕັ້ງຄ່າແລະການນໍາໃຊ້.

Phi-4 Multimodal ແມ່ນຫຍັງ ແລະເປັນຫຍັງມັນຈຶ່ງກ່ຽວຂ້ອງ?

ດັ່ງທີ່ Microsoft ອະທິບາຍຢູ່ໃນມັນ ເວັບໄຊທ໌ທາງການ, Phi-4 Multimodal ມັນເປັນແບບຈໍາລອງທາງປັນຍາປະດິດທີ່ກ້າວຫນ້າທີ່ສຸດທີ່ບໍລິສັດໄດ້ສ້າງຈົນເຖິງປະຈຸບັນ. ບໍ່ເຫມືອນກັບສະບັບທີ່ຜ່ານມາໄດ້ສຸມໃສ່ການປະມວນຜົນຄໍາ, ສະບັບໃຫມ່ນີ້ລວມ ວິທີການ multimodal ທີ່ປະສົມປະສານຂໍ້ຄວາມ, ຮູບພາບແລະສຽງຢູ່ໃນລະບົບດຽວ.

ເນື້ອຫາສະເພາະ - ຄລິກທີ່ນີ້  ສາມາດໃຊ້ Alexa ຫລິ້ນເກມ ຫຼືເລົ່າເລື່ອງຕະຫລົກໄດ້ແນວໃດ?

ຂໍຂອບໃຈທ່ານ ສະຖາປັດຕະຍະ ກຳ ທີ່ດີທີ່ສຸດ ກັບ 14.000 ຕື້ຕົວກໍານົດການPhi-4 Multimodal ບັນລຸໄດ້ປະສິດທິພາບດີເດັ່ນໃນການແປພາສາເຄື່ອງ, ການຮັບຮູ້ສຽງເວົ້າ ແລະວຽກງານການຊ່ວຍເຫຼືອການສົນທະນາ. ຖ້າທ່ານຕ້ອງການຮຽນຮູ້ເພີ່ມເຕີມກ່ຽວກັບລັກສະນະຂອງເຕັກໂນໂລຢີນີ້, ທ່ານສາມາດກວດເບິ່ງລາຍລະອຽດເພີ່ມເຕີມໃນບົດຄວາມຂອງພວກເຮົາທີ່ອຸທິດຕົນເພື່ອມັນ. ຮູບແບບ Microsoft AI.

ຄວາມຕ້ອງການຂັ້ນຕ່ໍາໃນການຕິດຕັ້ງ Phi-4 Multimodal ໃນ Windows 11

ກ່ອນທີ່ຈະດໍາເນີນການຕິດຕັ້ງ, ມັນເປັນສິ່ງຈໍາເປັນເພື່ອຮັບປະກັນວ່າອຸປະກອນຂອງທ່ານຕອບສະຫນອງຄວາມຕ້ອງການດັ່ງຕໍ່ໄປນີ້: ຄວາມຕ້ອງການ:

  • ບັດກາຟິກ (GPU): RTX A6000 ຖືກແນະນໍາສໍາລັບການປະຕິບັດທີ່ດີທີ່ສຸດ.
  • ຊ່ອງແຜ່ນ: ຢ່າງນ້ອຍ 40 GB ຂອງບ່ອນຈັດເກັບຂໍ້ມູນຟຣີ.
  • ຫນ່ວຍຄວາມ ຈຳ RAM: ແນະນໍາຢ່າງໜ້ອຍ 48 GB.
  • ໂປເຊດເຊີ (CPU): 48 cores ສໍາລັບການປະຕິບັດກ້ຽງ.

ວິທີການຕິດຕັ້ງ Phi-4 Multimodal ໃນ Windows 11

ວິທີການຕິດຕັ້ງ Microsoft Phi-4 Multimodal ໃນ Windows 11

 

ຂ້າງລຸ່ມນີ້ພວກເຮົາລາຍລະອຽດຂັ້ນຕອນການຕິດຕັ້ງ Microsoft Phi-4 Multimodal ໃນ Windows 11 ຂັ້ນຕອນໂດຍຂັ້ນຕອນ:

1. ດາວນ໌ໂຫລດແລະຕິດຕັ້ງ Ollama

Ollama ແມ່ນ​ເວ​ທີ​ທີ່​ອະ​ນຸ​ຍາດ​ໃຫ້​ທ່ານ​ເພື່ອ​ດໍາ​ເນີນ​ການ Phi-4 Multimodal ໃນ​ຄອມ​ພິວ​ເຕີ​ທ້ອງ​ຖິ່ນ​ຂອງ​ທ່ານ​. ການຕິດຕັ້ງມັນ, ສິ່ງທໍາອິດທີ່ຕ້ອງເຮັດແມ່ນດໍາເນີນການຄໍາສັ່ງຕໍ່ໄປນີ້ໃນ Windows terminal:

ເນື້ອຫາສະເພາະ - ຄລິກທີ່ນີ້  Anthropic ເລັ່ງການລົງທຶນຂອງຕົນ: 50.000 ຕື້ເອີໂຣສໍາລັບໂຄງສ້າງພື້ນຖານແລະການຂະຫຍາຍຢູ່ໃນເອີຣົບ

curl -fsSL https://ollama.com/install.sh | sh

2. ຕັ້ງສະພາບແວດລ້ອມ

ເມື່ອ Ollama ຖືກຕິດຕັ້ງ, ມັນຈໍາເປັນຕ້ອງກໍານົດສະພາບແວດລ້ອມທີ່ເຫມາະສົມສໍາລັບ Phi-4 Multimodal. ນີ້ປະກອບມີ ການເລືອກຊັບພະຍາກອນຮາດແວທີ່ຖືກຕ້ອງ ແລະປັບການຕັ້ງຄ່າລະບົບ.

3. ດາວໂຫຼດ ແລະເປີດ Phi-4 Multimodal

ເມື່ອການຕັ້ງຄ່າສໍາເລັດ, ເພື່ອໃຫ້ໄດ້ຮັບຮູບແບບທີ່ພວກເຮົາຕ້ອງປະຕິບັດຄໍາສັ່ງຕໍ່ໄປນີ້ໃນ terminal:

ollama pull vanilj/Phi-4

ເມື່ອ​ການ​ດາວ​ໂຫຼດ​ສໍາ​ເລັດ​ສົມ​ບູນ​, ພວກ​ເຮົາ​ເລີ່ມ​ຕົ້ນ​ຮູບ​ແບບ​ທີ່​ມີ​:

ollama run vanilj/Phi-4

ໃຊ້ Phi-4 Multimodal ໃນ Azure AI Foundry

azure ai foundry

ທາງເລືອກອື່ນທີ່ຈະໃຊ້ Phi-4 Multimodal ແມ່ນຜ່ານແພລະຕະຟອມຄລາວຂອງ Microsoft, Azure AI Foundry. ທາງເລືອກນີ້ອະນຸຍາດໃຫ້ເຂົ້າເຖິງຄວາມສາມາດຂອງຕົວແບບ ບໍ່ຈໍາເປັນຕ້ອງມີການຕິດຕັ້ງໃນທ້ອງຖິ່ນ.

ເພື່ອນຳໃຊ້ Phi-4 Multimodal ເທິງ Azure, ໃຫ້ເຮັດຕາມຂັ້ນຕອນເຫຼົ່ານີ້:

  1. ເຂົ້າເຖິງປະຕູ Azure AI Foundry.
  2. ເລືອກຕົວເລືອກການນຳໃຊ້ຕົວແບບຂອງ Phi-4 Multimodal.
  3. ປະຕິບັດຕາມຄໍາແນະນໍາສໍາລັບການຕິດຕັ້ງແລະການນໍາໃຊ້.

ການປຽບທຽບກັບຕົວແບບ AI ອື່ນໆ

 

ເນື້ອຫາສະເພາະ - ຄລິກທີ່ນີ້  ວິທີການທີ່ປັນຍາປະດິດຖືກ ນຳ ໃຊ້ເຂົ້າໃນກິລາ

Phi-4 Multimodal ໄດ້ສະແດງໃຫ້ເຫັນ a ປະສິດທິພາບທີ່ໂດດເດັ່ນ ໃນ​ວຽກ​ງານ​ການ​ປຸງ​ແຕ່ງ​ພາ​ສາ​ທໍາ​ມະ​ຊາດ​ແລະ​ການ​ຮັບ​ຮູ້​ສຽງ​ເວົ້າ​. ເມື່ອປຽບທຽບກັບຕົວແບບເຊັ່ນ Gemini Pro ແລະ GPT-4o, ປະໂຫຍດຂອງມັນແມ່ນຢູ່ໃນ ປະສິດທິຜົນ ທີ່ທ່ານຈັດການກັບຂໍ້ມູນຫຼາຍປະເພດພ້ອມກັນ.

ໃນການທົດສອບມາດຕະຖານ, Phi-4 Multimodal ໄດ້ປະຕິບັດຕົວແບບອ້າງອີງໃນວຽກງານເຊັ່ນ:

  • ການຮັບຮູ້ສຽງຂັ້ນສູງ.
  • ການແປດ້ວຍເຄື່ອງຈັກທີ່ມີຄວາມຊັດເຈນສູງ.
  • ການໂຕ້ຕອບແບບ Multimodal ໃນເວລາຈິງ.

Microsoft ໄດ້ກ້າວໄປຂ້າງໜ້າອັນສຳຄັນກັບ Phi-4 Multimodal, ສະເໜີໃຫ້ຜູ້ໃຊ້ມີເຄື່ອງມືທີ່ແຂງແຮງ ແລະຫຼາກຫຼາຍຊະນິດທີ່ກຳນົດທ່າແຮງຂອງປັນຍາປະດິດໃນບ້ານ ແລະທຸລະກິດ. ການຕິດຕັ້ງຂອງມັນຢູ່ໃນ Windows 11 ອະນຸຍາດໃຫ້ທ່ານໃຊ້ປະໂຫຍດຈາກຮູບແບບທີ່ທັນສະໄຫມທີ່ປະສົມປະສານສຽງ, ຮູບພາບແລະຂໍ້ຄວາມທີ່ມີສຽງ. ຄວາມຄ່ອງຕົວທີ່ບໍ່ເຄີຍມີມາກ່ອນ.