Kaip įdiegti „Microsoft Phi-4 Multimodal“ sistemoje „Windows 11“.

Paskutiniai pakeitimai: 02/03/2025

Phi-4 Multimodal

Prieš kelias dienas šiame tinklaraštyje pakartojome paleidimą Microsoft Phi-4 Multimodal, ambicingas dirbtinio intelekto modelis, skirtas vienu metu apdoroti tekstą, vaizdus ir balsą. Proveržis, kuris reiškia a reikšmingas etapas AI evoliucijoje, įgalinantis natūralesnę ir efektyvesnę sąveiką su įrenginiais. Dabar pažiūrėkime Kaip įdiegti „Phi-4 Multimodal“ sistemoje „Windows 11“. ir pradėkite mėgautis jo pranašumais.

Informacija, kurią pateikiame šiame straipsnyje, bus labai naudinga norint pasinaudoti didele šio AI galia. Čia rasite išsamų nuoseklų diegimo procesą nuo minimalių reikalavimų iki konfigūracijos ir naudojimo.

Kas yra Phi-4 Multimodal ir kodėl tai aktualu?

Kaip „Microsoft“ paaiškina savo oficiali svetainė, Phi-4 Multimodal Tai pažangiausias dirbtinio intelekto modelis, kurį bendrovė sukūrė iki šiol. Skirtingai nuo ankstesnių versijų, skirtų teksto apdorojimui, ši nauja versija apima multimodalinis metodas, sujungiantis tekstą, vaizdus ir balsą vienoje sistemoje.

Išskirtinis turinys – spustelėkite čia  Kas yra Copilot ir kam jis skirtas? Sužinokite, kaip tai padidina jūsų produktyvumą ir kodą

Jūsų dėka optimizuota architektūra su 14.000 milijardų parametrų„Phi-4 Multimodal“ pasiekia puikų našumą atliekant mašininio vertimo, kalbos atpažinimo ir pokalbio pagalbos užduotis. Jei norite sužinoti daugiau apie šios technologijos ypatybes, galite sužinoti daugiau apie tai mūsų straipsnyje. Microsoft AI modelis.

Minimalūs reikalavimai norint įdiegti „Phi-4 Multimodal“ sistemoje „Windows 11“.

Prieš pradedant montuoti, būtina įsitikinti, kad jūsų įranga atitinka šiuos reikalavimus: reikalavimai:

  • Vaizdo plokštė (GPU): RTX A6000 rekomenduojamas optimaliam veikimui.
  • Disko vieta: mažiausiai 40 GB nemokamos saugyklos vietos.
  • RAM: Rekomenduojama mažiausiai 48 GB.
  • Procesorius (CPU): 48 branduoliai sklandžiam vykdymui.

Kaip įdiegti „Phi-4 Multimodal“ sistemoje „Windows 11“.

Kaip įdiegti „Microsoft Phi-4 Multimodal“ sistemoje „Windows 11“.

 

Toliau išsamiai aprašome „Microsoft Phi-4 Multimodal“ diegimo „Windows 11“ procesą žingsnis po žingsnio:

1. Atsisiųskite ir įdiekite „Ollama“.

„Ollama“ yra platforma, leidžianti paleisti „Phi-4 Multimodal“ vietiniame kompiuteryje. Norėdami jį įdiegti, pirmas dalykas, kurį reikia padaryti, yra paleisti šią komandą „Windows“ terminale:

Išskirtinis turinys – spustelėkite čia  „Meta Vibes“: naujas dirbtinio intelekto vaizdo įrašų srautas „Meta AI“ platformoje

curl -fsSL https://ollama.com/install.sh | sh

2. Sutvarkykite aplinką

Įdiegus „Ollama“, reikia sukonfigūruoti tinkamą Phi-4 Multimodal aplinką. Tai apima Tinkamų aparatinės įrangos išteklių pasirinkimas ir koreguoti sistemos nustatymus.

3. Atsisiųskite ir paleiskite „Phi-4 Multimodal“.

Baigę nustatymus, norėdami gauti modelį, terminale turime vykdyti šią komandą:

ollama pull vanilj/Phi-4

Kai atsisiuntimas bus baigtas, pradedame modelį su:

ollama run vanilj/Phi-4

„Phi-4 Multimodal“ naudojimas „Azure AI Foundry“.

azure ai liejykla

Kita galimybė naudoti „Phi-4 Multimodal“ yra „Microsoft“ debesies platforma, Azure AI liejykla. Ši alternatyva leidžia pasiekti modelio galimybes nereikia vietinio diegimo.

Norėdami įdiegti „Phi-4 Multimodal“ sistemoje „Azure“, atlikite šiuos veiksmus:

  1. Pasiekite Azure AI Foundry portalą.
  2. Pasirinkite Phi-4 multimodalinio modelio diegimo parinktį.
  3. Vykdykite sąrankos ir naudojimo instrukcijas.

Palyginimas su kitais AI modeliais

 

Išskirtinis turinys – spustelėkite čia  Pora važiavo daugiau nei tris valandas, kad pamatytų neegzistuojančią vietą: dirbtinis intelektas jau generuoja netikras turistines vietas.

Phi-4 Multimodal parodė a nepakartojamas pasirodymas atliekant natūralios kalbos apdorojimo ir kalbos atpažinimo užduotis. Palyginti su tokiais modeliais kaip Gemini Pro ir GPT-4o, jo pranašumas slypi tame efektyvumas su kuria vienu metu tvarkote kelių tipų duomenis.

Atliekant lyginamuosius testus, „Phi-4 Multimodal“ pranoko etaloninius modelius tokiose užduotyse kaip:

  • Pažangus balso atpažinimas.
  • Didelio tikslumo mašininis vertimas.
  • Multimodalinė sąveika realiu laiku.

„Microsoft“ žengė didelį žingsnį į priekį su „Phi-4 Multimodal“, pasiūlydama vartotojams tvirtą ir universalų įrankį, kuris iš naujo apibrėžia dirbtinio intelekto potencialą namuose ir versle. Įdiegus jį sistemoje „Windows 11“, galėsite pasinaudoti pažangiausiu modeliu, kuris integruoja balsą, vaizdą ir tekstą su precedento neturintis sklandumas.