Microsoft Phi-4 Multimodal: AI nke na-aghọta olu, onyonyo na ederede

Mmelite ikpeazụ: 27/02/2025

  • Microsoft weputara Phi-4-multimodal, ụdị AI nke na-ahazi olu, onyonyo na ederede n'otu oge.
  • Site na 5.600 ijeri paramita, ọ na-akarị ụdị dị ukwuu na njirimara olu na ọhụụ.
  • Gụnyere Phi-4-mini, ụdị lekwasịrị anya naanị na ọrụ nhazi okwu.
  • Dị na Azure AI Foundry, Hugging Face, na NVIDIA, nwere ngwa dị iche iche na azụmahịa na agụmakwụkwọ.
Kedu ihe bụ Phi-4 multimodal-0

Microsoft emeela nzọụkwụ n'ihu n'ụwa ụdị asụsụ nwere multimodal Phi-4, ọgụgụ isi ya kachasị ọhụrụ na nke kachasị elu nwere ike ịhazi ederede, onyonyo na olu n'otu oge. Ihe nlereanya a, yana Phi-4-mini, na-anọchi anya a Evolution na ikike nke obere ụdị (SLM), na-enye arụmọrụ na izi ezi na-enweghị mkpa maka oke oke.

Ọbịbịa nke Phi-4-multimodal abụghị naanị na-anọchite anya nkwalite teknụzụ maka Microsoft, kamakwa Ọ na-asọmpi ozugbo na ụdị ndị buru ibu dị ka ndị sitere na Google na Anthropic. Ya kacha mma ije na elu echiche ike na-eme ya nhọrọ mara mma maka otutu ngwa, site na ntụgharị igwe gaa na onyonyo na njirimara olu.

Ọdịnaya pụrụiche - Pịa ebe a  Ngwa Gemini ọhụrụ gị wijetị rutere na gam akporo.

Kedu ihe bụ Phi-4-multimodal na kedu ka ọ si arụ ọrụ?

Phi-4 Microsoft

Phi-4-multimodal bụ ụdị AI nke Microsoft mepụtara nke nwere ike hazie ederede, onyonyo na olu n'otu oge.. N'adịghị ka ụdị omenala ndị na-arụ ọrụ na otu ụdị, ọgụgụ isi a na-ejikọta ihe ọmụma dị iche iche n'ime otu oghere nnọchiteanya, ekele maka iji usoro mmụta gafere.

The nlereanya na-ewu na ihe ije nke 5.600 ijeri parameters, na-eji usoro a maara dị ka LoRAs (Low-Rank Adaptations) iji jikọta ụdị data dị iche iche. Nke a na-enye ohere ka ukwuu nkenke na nhazi asụsụ na nkọwa miri emi nke ihe ndị gbara ya gburugburu.

Ikike na uru dị mkpa

Phi-4-multimodal dị irè karịsịa n'ọtụtụ ọrụ dị mkpa nke chọrọ ọkwa dị elu nke ọgụgụ isi:

  • Nkwupụta okwu: Ọ karịrị ụdị pụrụ iche dị ka WhisperV3 na nyocha ntụgharị asụsụ na igwe.
  • Nhazi onyonyo: Ọ nwere ike ịtụgharị akwụkwọ, eserese na ịrụ OCR n'ụzọ ziri ezi.
  • Ntinye aka dị ala: Nke a na-enye ohere ka ọ na-agba ọsọ na ngwaọrụ mkpanaka na obere ike na-enweghị ịchụ àjà.
  • Mmekọrịta na-enweghị ntụpọ n'etiti usoro: Ikike ha ịghọta ederede, okwu na onyonyo ọnụ na-eme ka echiche ha na-atụgharị uche.
Ọdịnaya pụrụiche - Pịa ebe a  AMD na Stability AI na-agbanwe ntụgharị AI mpaghara na laptọọpụ na Amuse 3.1

Tụnyere ụdị ndị ọzọ

PHI-4-arụmọrụ multimodal

N'ihe gbasara arụmọrụ, Phi-4-multimodal egosila na ọ dị nha na ụdị ndị buru ibu. Tụnyere Gemini-2-Flash-lite na Claude-3.5-Sonnet, na-enweta nsonaazụ yiri nke ahụ na ọrụ multimodal, ebe ọ na-ejigide arụmọrụ dị elu n'ihi nhazi nhazi ya.

Otú ọ dị, na-egosi ụfọdụ mmachi na ajụjụ na azịza dabere na olu, Ebe ụdị dị ka GPT-4o na Gemini-2.0-Flash nwere uru. Nke a bụ n'ihi obere ihe nlereanya ya. nke na-emetụta njigide ihe ọmụma nke eziokwu. Microsoft egosila na ọ na-arụ ọrụ iji kwalite ikike a na ụdị n'ọdịnihu.

Phi-4-mini: nwanne obere nke Phi-4-multimodal

Tinyere Phi-4-multimodal, Microsoft ewepụtakwala ya Phi-4-mini, ụdịdị emebere maka ọrụ dabere na ederede akọwapụtara. Emebere ihe nlereanya a iji nye oke arụmọrụ na nhazi asụsụ eke, na-eme ka ọ dị mma maka chatbots, ndị enyemaka mebere, na ngwa ndị ọzọ chọrọ nghọta ziri ezi na ọgbọ ederede.

Nnweta na ngwa

Kedu ihe bụ Phi-4 multimodal-5

Microsoft emela Phi-4-multimodal na Phi-4-mini maka ndị mmepe site na Azure AI Foundry, ihu ịmakụ, yana katalọgụ API API. Nke a pụtara na ụlọ ọrụ ọ bụla ma ọ bụ onye ọrụ nwere ohere ịnweta nyiwe ndị a nwere ike ịmalite ịnwale ụdị ahụ wee tinye ya n'ọnọdụ dị iche iche.

Ọdịnaya pụrụiche - Pịa ebe a  Gemma 3n: Ọrụ ọhụrụ Google wetara AI dị elu na ngwaọrụ ọ bụla

Nyere ya multimodal ụzọ, Phi-4 bụ Ezubere maka ngalaba dịka:

  • Ntụgharị asụsụ igwe na ntinye ederede ozugbo.
  • Nchọpụta akwụkwọ na nyocha maka ụlọ ọrụ.
  • Ngwa mkpanaka nwere ndị enyemaka nwere ọgụgụ isi.
  • Ụdị agụmakwụkwọ iji melite nkuzi dabere na AI.

Microsoft enyela a mgbagwoju anya na-adọrọ mmasị na ụdị ndị a site n'ilekwasị anya na arụmọrụ na scalability. Site na asọmpi na-abawanye n'ọhịa nke ụdị obere asụsụ (SLM), A na-ewepụta Phi-4-multimodal dị ka ihe ga-ekwe omume na ụdị ndị buru ibu, na-enye nguzozi n'etiti arụmọrụ na ikike nhazi inweta ọbụna na obere ike ngwaọrụ.