- Namoaka Phi-4-multimodal i Microsoft, maodely AI izay manodina feo, sary ary lahatsoratra miaraka.
- Miaraka amin'ny mari-pamantarana 5.600 lavitrisa, dia manoatra noho ny modely lehibe kokoa amin'ny famantarana feo sy fahitana.
- Ahitana Phi-4-mini, dikan-teny mifantoka manokana amin'ny asa fanodinana teny.
- Azo alaina amin'ny Azure AI Foundry, Hugging Face, ary NVIDIA, miaraka amin'ny fampiharana isan-karazany amin'ny fandraharahana sy fanabeazana.
Microsoft dia nanao dingana mandroso eo amin'ny tontolon'ny maodely fiteny miaraka amin'ny multimodal Phi-4. Ity modely ity, miaraka amin'ny Phi-4-mini, dia maneho a Evolisiona amin'ny fahafahan'ny modely kely (SLM), manolotra fahombiazana sy fahitsiana tsy mila masontsivana be dia be.
Ny fahatongavan'ny Phi-4-multimodal dia tsy maneho fanatsarana ara-teknolojia ho an'ny Microsoft ihany, fa koa Mifaninana mivantana amin'ireo modely lehibe kokoa toa an'ireo avy amin'ny Google sy Anthropic. Ny maritrano nohatsaraina sy ny fahaizany misaina mandroso no mahatonga azy io safidy manintona ho an'ny fampiharana maro, manomboka amin'ny fandikana milina mankany amin'ny fahafantarana sary sy feo.
Inona ny Phi-4-multimodal ary ahoana no fiasan'izany?

Phi-4-multimodal dia maodely AI novolavolain'i Microsoft izay afaka mamadika lahatsoratra, sary ary feo miaraka.. Tsy toy ny modely nentim-paharazana izay miasa amin'ny fomba tokana, ity faharanitan-tsaina artifisialy ity dia mampiditra loharanom-baovao isan-karazany ao anaty habaka fanehoana tokana, noho ny fampiasana teknika cross-learning.
Ny modely dia naorina tamin'ny maritrano iray 5.600 lavitrisa paramètre, mampiasa teknika fantatra amin'ny anarana hoe LoRAs (Adaptation Low-Rank) hanambatra karazana data. Izany dia manome fahafahana bebe kokoa amin'ny fanodinana fiteny sy fandikana lalindalina kokoa ny teny manodidina.
Ny fahaiza-manao sy ny tombontsoa lehibe
Ny Phi-4-multimodal dia mahomby indrindra amin'ny asa lehibe maro izay mitaky fahaizana artifisialy avo lenta:
- Fanekena ny kabary: Mihoatra noho ny maodely manokana toy ny WhisperV3 amin'ny andrana fandikana sy fandikana milina.
- Fanodinana sary: Mahay mandika antontan-taratasy, sary ary manao OCR amin'ny fomba marina tsara izy io.
- Famintinana fohy fohy: Izany dia ahafahany mandeha amin'ny fitaovana finday sy ambany hery nefa tsy manao sorona ny fampisehoana.
- Fampidirana tsy misy dikany eo amin'ny fomba fiasa: Ny fahaizan'izy ireo mahatakatra lahatsoratra, kabary ary sary miaraka dia manatsara ny fanjohian-keviny.
Ampitahao amin'ny modely hafa

Amin'ny lafiny fampisehoana, ny Phi-4-multimodal dia voaporofo fa mitovy amin'ny modely lehibe kokoa. Raha oharina amin'ny Gemini-2-Flash-lite sy Claude-3.5-Sonnet, dia mahatratra vokatra mitovy amin'ny asa multimodaly, ary mitazona ny fahombiazany ambony noho ny famolavolana azy.
Na izany aza, dia manolotra fetra sasany amin'ny fanontaniana sy valiny mifototra amin'ny feo, izay manana tombony ny modely toy ny GPT-4o sy Gemini-2.0-Flash. Izany dia noho ny habeny modely kely kokoa, izay misy fiantraikany amin'ny fitazonana ny fahalalana marina. Nanambara i Microsoft fa miasa hanatsara izany fahaiza-manao izany amin'ny dikan-teny ho avy.
Phi-4-mini: zandrin'i Phi-4-multimodal
Miaraka amin'ny Phi-4-multimodal, Microsoft dia nanomboka ihany koa Phi-4-mini, variana namboarina ho an'ny asa manokana mifototra amin'ny lahatsoratra. Ity modely ity dia natao hanolotra fahombiazana ambony amin'ny fanodinana fiteny voajanahary, ka mahatonga azy ho tonga lafatra ho an'ny chatbots, mpanampy virtoaly, ary fampiharana hafa izay mitaky fahatakarana marina sy famoronana lahatsoratra.
Ny fisiana sy ny fampiharana

Microsoft dia nanao Phi-4-multimodal sy Phi-4-mini ho an'ny mpamorona amin'ny alàlan'ny Azure AI Foundry, Mamihina tarehy, ary ny NVIDIA API Catalog. Midika izany fa izay orinasa na mpampiasa manana fidirana amin'ireo sehatra ireo dia afaka manomboka manandrana ny modely ary mampihatra izany amin'ny sehatra samihafa.
Raha jerena ny fomba fiasa multimodal, ny Phi-4 dia Kendrena amin’ny sehatra toy ny:
- Fandikan-teny amin'ny milina sy dikanteny amin'ny fotoana tena izy.
- Fanekena sy famakafakana antontan-taratasy ho an'ny orinasa.
- Fampiharana finday misy mpanampy manan-tsaina.
- Modely fanabeazana hanatsarana ny fampianarana mifototra amin'ny AI.
Microsoft dia nanome a miolakolaka mahaliana miaraka amin'ireo modely ireo amin'ny fifantohana amin'ny fahombiazana sy ny scalability. Miaraka amin'ny fitomboan'ny fifaninanana eo amin'ny sehatry ny modely amin'ny fiteny madinika (SLM), Ny Phi-4-multimodal dia aseho ho safidy azo ampiasaina amin'ny modely lehibe kokoa, manolotra fifandanjana eo amin'ny fahombiazana sy ny fahaiza-manao fanodinana azo idirana na dia amin'ny fitaovana tsy dia matanjaka loatra aza.
Mpikatroka teknolojia aho izay namadika ny tombontsoany "geek" ho lasa asa. Nandany mihoatra ny 10 taona teo amin'ny fiainako aho tamin'ny fampiasana ny teknolojia avo lenta sy ny fikojakojana ny karazana fandaharana rehetra noho ny fahalianana madiodio. Manampahaizana manokana amin'ny teknolojia informatika sy lalao video aho izao. Izany dia satria nandritra ny 5 taona mahery no nanoratako ho an'ny tranokala isan-karazany momba ny teknolojia sy lalao video, mamorona lahatsoratra izay mitady hanome anao ny fampahalalana ilainao amin'ny fiteny azon'ny rehetra.
Raha manana fanontaniana ianao, ny fahalalako dia avy amin'ny zavatra rehetra mifandraika amin'ny rafitra fiasan'ny Windows ary koa ny Android ho an'ny finday. Ary ny fanoloran-tenako dia aminao, vonona foana aho handany minitra vitsivitsy ary hanampy anao hamaha ny fanontaniana mety ho azonao eto amin'ity tontolon'ny Internet ity.