Microsoft Phi-4 Multimodal: AI izay mahatakatra ny feo, sary ary lahatsoratra

Fanavaozana farany: 27/02/2025

  • Namoaka Phi-4-multimodal i Microsoft, maodely AI izay manodina feo, sary ary lahatsoratra miaraka.
  • Miaraka amin'ny mari-pamantarana 5.600 lavitrisa, dia manoatra noho ny modely lehibe kokoa amin'ny famantarana feo sy fahitana.
  • Ahitana Phi-4-mini, dikan-teny mifantoka manokana amin'ny asa fanodinana teny.
  • Azo alaina amin'ny Azure AI Foundry, Hugging Face, ary NVIDIA, miaraka amin'ny fampiharana isan-karazany amin'ny fandraharahana sy fanabeazana.
Inona ny Phi-4 multimodal-0

Microsoft dia nanao dingana mandroso eo amin'ny tontolon'ny maodely fiteny miaraka amin'ny multimodal Phi-4. Ity modely ity, miaraka amin'ny Phi-4-mini, dia maneho a Evolisiona amin'ny fahafahan'ny modely kely (SLM), manolotra fahombiazana sy fahitsiana tsy mila masontsivana be dia be.

Ny fahatongavan'ny Phi-4-multimodal dia tsy maneho fanatsarana ara-teknolojia ho an'ny Microsoft ihany, fa koa Mifaninana mivantana amin'ireo modely lehibe kokoa toa an'ireo avy amin'ny Google sy Anthropic. Ny maritrano nohatsaraina sy ny fahaizany misaina mandroso no mahatonga azy io safidy manintona ho an'ny fampiharana maro, manomboka amin'ny fandikana milina mankany amin'ny fahafantarana sary sy feo.

Votoaty manokana - Tsindrio eto  Tonga amin'ny Android ny Widget Material You vaovao an'ny Gemini.

Inona ny Phi-4-multimodal ary ahoana no fiasan'izany?

Phi-4 Microsoft

Phi-4-multimodal dia maodely AI novolavolain'i Microsoft izay afaka mamadika lahatsoratra, sary ary feo miaraka.. Tsy toy ny modely nentim-paharazana izay miasa amin'ny fomba tokana, ity faharanitan-tsaina artifisialy ity dia mampiditra loharanom-baovao isan-karazany ao anaty habaka fanehoana tokana, noho ny fampiasana teknika cross-learning.

Ny modely dia naorina tamin'ny maritrano iray 5.600 lavitrisa paramètre, mampiasa teknika fantatra amin'ny anarana hoe LoRAs (Adaptation Low-Rank) hanambatra karazana data. Izany dia manome fahafahana bebe kokoa amin'ny fanodinana fiteny sy fandikana lalindalina kokoa ny teny manodidina.

Ny fahaiza-manao sy ny tombontsoa lehibe

Ny Phi-4-multimodal dia mahomby indrindra amin'ny asa lehibe maro izay mitaky fahaizana artifisialy avo lenta:

  • Fanekena ny kabary: Mihoatra noho ny maodely manokana toy ny WhisperV3 amin'ny andrana fandikana sy fandikana milina.
  • Fanodinana sary: Mahay mandika antontan-taratasy, sary ary manao OCR amin'ny fomba marina tsara izy io.
  • Famintinana fohy fohy: Izany dia ahafahany mandeha amin'ny fitaovana finday sy ambany hery nefa tsy manao sorona ny fampisehoana.
  • Fampidirana tsy misy dikany eo amin'ny fomba fiasa: Ny fahaizan'izy ireo mahatakatra lahatsoratra, kabary ary sary miaraka dia manatsara ny fanjohian-keviny.
Votoaty manokana - Tsindrio eto  Ny AMD sy Stability AI dia manova ny famandrihana AI eo an-toerana amin'ny solosaina finday miaraka amin'ny Amuse 3.1

Ampitahao amin'ny modely hafa

PHI-4 - fampisehoana multimodal

Amin'ny lafiny fampisehoana, ny Phi-4-multimodal dia voaporofo fa mitovy amin'ny modely lehibe kokoa. Raha oharina amin'ny Gemini-2-Flash-lite sy Claude-3.5-Sonnet, dia mahatratra vokatra mitovy amin'ny asa multimodaly, ary mitazona ny fahombiazany ambony noho ny famolavolana azy.

Na izany aza, dia manolotra fetra sasany amin'ny fanontaniana sy valiny mifototra amin'ny feo, izay manana tombony ny modely toy ny GPT-4o sy Gemini-2.0-Flash. Izany dia noho ny habeny modely kely kokoa, izay misy fiantraikany amin'ny fitazonana ny fahalalana marina. Nanambara i Microsoft fa miasa hanatsara izany fahaiza-manao izany amin'ny dikan-teny ho avy.

Phi-4-mini: zandrin'i Phi-4-multimodal

Miaraka amin'ny Phi-4-multimodal, Microsoft dia nanomboka ihany koa Phi-4-mini, variana namboarina ho an'ny asa manokana mifototra amin'ny lahatsoratra. Ity modely ity dia natao hanolotra fahombiazana ambony amin'ny fanodinana fiteny voajanahary, ka mahatonga azy ho tonga lafatra ho an'ny chatbots, mpanampy virtoaly, ary fampiharana hafa izay mitaky fahatakarana marina sy famoronana lahatsoratra.

Ny fisiana sy ny fampiharana

Inona ny Phi-4 multimodal-5

Microsoft dia nanao Phi-4-multimodal sy Phi-4-mini ho an'ny mpamorona amin'ny alàlan'ny Azure AI Foundry, Mamihina tarehy, ary ny NVIDIA API Catalog. Midika izany fa izay orinasa na mpampiasa manana fidirana amin'ireo sehatra ireo dia afaka manomboka manandrana ny modely ary mampihatra izany amin'ny sehatra samihafa.

Votoaty manokana - Tsindrio eto  Gemma 3n: Fikarohana vaovao an'i Google hitondra AI mandroso amin'ny fitaovana rehetra

Raha jerena ny fomba fiasa multimodal, ny Phi-4 dia Kendrena amin’ny sehatra toy ny:

  • Fandikan-teny amin'ny milina sy dikanteny amin'ny fotoana tena izy.
  • Fanekena sy famakafakana antontan-taratasy ho an'ny orinasa.
  • Fampiharana finday misy mpanampy manan-tsaina.
  • Modely fanabeazana hanatsarana ny fampianarana mifototra amin'ny AI.

Microsoft dia nanome a miolakolaka mahaliana miaraka amin'ireo modely ireo amin'ny fifantohana amin'ny fahombiazana sy ny scalability. Miaraka amin'ny fitomboan'ny fifaninanana eo amin'ny sehatry ny modely amin'ny fiteny madinika (SLM), Ny Phi-4-multimodal dia aseho ho safidy azo ampiasaina amin'ny modely lehibe kokoa, manolotra fifandanjana eo amin'ny fahombiazana sy ny fahaiza-manao fanodinana azo idirana na dia amin'ny fitaovana tsy dia matanjaka loatra aza.