مائڪروسافٽ فائي-4 ملٽي ماڊل: اي آءِ جيڪو آواز، تصويرن ۽ متن کي سمجهي ٿو

آخري تازه ڪاري: 27/02/2025

  • مائڪروسوفٽ فائي-4-ملٽي موڊل لانچ ڪيو، هڪ اي آءِ ماڊل جيڪو آواز، تصويرن ۽ ٽيڪسٽ کي هڪ ئي وقت پروسيس ڪري ٿو.
  • 5.600 ارب پيرا ميٽرز سان، اهو آواز ۽ بصري سڃاڻپ ۾ وڏن ماڊلز کان بهتر ڪارڪردگي ڏيکاري ٿو.
  • فائي-4-ميني شامل آهي، هڪ نسخو جيڪو خاص طور تي ورڊ پروسيسنگ ڪمن تي ڌيان ڏئي ٿو.
  • ڪاروبار ۽ تعليم ۾ مختلف ايپليڪيشنن سان، Azure AI Foundry، Hugging Face، ۽ NVIDIA تي موجود آهي.
فائي-4 ملٽي موڊل-0 ڇا آهي؟

مائڪروسوفٽ ملٽي ماڊل فائي-4 سان ٻولي ماڊلز جي دنيا ۾ هڪ قدم اڳتي وڌايو آهي.، ان جي جديد ۽ جديد ترين مصنوعي ذهانت جيڪا هڪ ئي وقت متن، تصويرن ۽ آواز کي پروسيس ڪرڻ جي قابل آهي. هي ماڊل، فائي-4-ميني سان گڏ، نمائندگي ڪري ٿو a ننڍن ماڊلز جي صلاحيت ۾ ارتقا (SLM)، وڏي مقدار ۾ پيرا ميٽرز جي ضرورت کان سواءِ ڪارڪردگي ۽ درستگي پيش ڪري ٿو.

فائي-4-ملٽي موڊل جي آمد نه رڳو مائڪروسافٽ لاءِ ٽيڪنالاجي جي بهتري جي نمائندگي ڪري ٿي، پر پڻ اهو گوگل ۽ اينٿروپڪ جهڙن وڏن ماڊلز سان سڌو مقابلو ڪري ٿو.. ان جي بهتر ڪيل فن تعمير ۽ جديد استدلال جون صلاحيتون ان کي گھڻن ايپليڪيشنن لاءِ هڪ پرڪشش آپشن، مشيني ترجمي کان وٺي تصوير ۽ آواز جي سڃاڻپ تائين.

خاص مواد - هتي ڪلڪ ڪريو  Gemini جا نوان Material You ويجيٽ Android تي اچي ويا آهن.

فائي-4-ملٽي موڊل ڇا آهي ۽ اهو ڪيئن ڪم ڪندو آهي؟

فائي-4 مائڪروسافٽ

فائي-4-ملٽي موڊل مائڪروسافٽ پاران تيار ڪيل هڪ AI ماڊل آهي جيڪو هڪ ئي وقت ٽيڪسٽ، تصويرن ۽ آواز کي پروسيس ڪري سگهي ٿو.. روايتي ماڊلز جي برعڪس جيڪي هڪ واحد موڊالٽي سان ڪم ڪن ٿا، هي مصنوعي ذهانت معلومات جي مختلف ذريعن کي هڪ واحد نمائندگي واري جاءِ ۾ ضم ڪري ٿي، ڪراس لرننگ ٽيڪنڪ جي استعمال جي مهرباني.

ماڊل هڪ فن تعمير تي ٺهيل آهي 5.600 بلين پيٽرولر، مختلف قسمن جي ڊيٽا کي ضم ڪرڻ لاءِ LoRAs (لو-رينڪ ​​ايڊاپٽيشنز) جي نالي سان مشهور ٽيڪنڪ استعمال ڪندي. هي ٻولي جي پروسيسنگ ۾ وڌيڪ درستگي ۽ تناظر جي گهري تشريح جي اجازت ڏئي ٿو.

اهم صلاحيتون ۽ فائدا

فائي-4-ملٽي موڊل خاص طور تي ڪيترن ئي اهم ڪمن ۾ اثرائتو آهي جن کي اعليٰ سطح جي مصنوعي ذهانت جي ضرورت هوندي آهي:

  • ڳالهه ٻولهه جي سڃاڻپ: اهو ٽرانسڪرپشن ۽ مشين ٽرانسليشن ٽيسٽن ۾ WhisperV3 جهڙن خاص ماڊلز کان بهتر ڪارڪردگي ڏيکاري ٿو.
  • تصويري پروسيسنگ: اهو دستاويزن، گرافڪس جي تشريح ڪرڻ ۽ او سي آر کي وڏي درستگي سان انجام ڏيڻ جي قابل آهي.
  • گھٽ دير جو اندازو: هي ان کي ڪارڪردگي کي نقصان پهچائڻ کان سواءِ موبائل ۽ گهٽ طاقت وارن ڊوائيسز تي هلائڻ جي اجازت ڏئي ٿو.
  • طريقن جي وچ ۾ بيحد انضمام: متن، تقرير ۽ تصويرن کي گڏجي سمجهڻ جي انهن جي صلاحيت انهن جي تناظري استدلال کي بهتر بڻائي ٿي.
خاص مواد - هتي ڪلڪ ڪريو  AMD ۽ Stability AI Amuse 3.1 سان ليپ ٽاپ تي مقامي AI رينڊرنگ ۾ انقلاب آڻين ٿا.

ٻين ماڊلز سان ڀيٽ

PHI-4-ملٽي موڊل ڪارڪردگي

ڪارڪردگي جي لحاظ کان، فائي-4-ملٽي ماڊل وڏن ماڊلز جي برابر ثابت ٿيو آهي. جيمينائي-2-فليش-لائيٽ ۽ ڪلاڊ-3.5-سونيٽ جي مقابلي ۾، ملٽي موڊل ڪمن ۾ ساڳيا نتيجا حاصل ڪري ٿو، جڏهن ته ان جي ڪمپيڪٽ ڊيزائن جي ڪري اعليٰ ڪارڪردگي برقرار رکي ٿو.

جڏهن ته، آواز تي ٻڌل سوالن ۽ جوابن ۾ ڪجهه حدون پيش ڪري ٿو، جتي GPT-4o ۽ Gemini-2.0-Flash جهڙن ماڊلز جو فائدو آهي. اهو ان جي ننڍڙي ماڊل سائيز جي ڪري آهي، جيڪو حقيقي علم جي برقرار رکڻ تي اثر انداز ٿئي ٿو. مائڪروسوفٽ اشارو ڏنو آهي ته اهو مستقبل جي نسخن ۾ هن صلاحيت کي بهتر بڻائڻ لاءِ ڪم ڪري رهيو آهي.

فائي-4-ميني: فائي-4-ملٽي موڊل جو ننڍو ڀاءُ

فائي-4-ملٽي موڊل سان گڏ، مائڪروسوفٽ پڻ لانچ ڪيو آهي فائي-4-مني، مخصوص ٽيڪسٽ تي ٻڌل ڪمن لاءِ بهتر ڪيل هڪ قسم. هي ماڊل پيش ڪرڻ لاءِ ٺهيل آهي قدرتي ٻولي پروسيسنگ ۾ اعليٰ ڪارڪردگي، ان کي چيٽ بوٽس، ورچوئل اسسٽنٽس، ۽ ٻين ايپليڪيشنن لاءِ مثالي بڻائي ٿو جن کي صحيح سمجھ ۽ متن جي پيداوار جي ضرورت آهي.

دستيابي ۽ ايپليڪيشنون

فائي-4 ملٽي موڊل-5 ڇا آهي؟

مائڪروسوفٽ ڊولپرز لاءِ فائي-4-ملٽي موڊل ۽ فائي-4-ميني دستياب ڪيا آهن ايزور اي آءِ فائونڊري، هگنگ فيس، ۽ اين وي آءِ ڊي آءِ اي آءِ ڪيٽلاگ. ان جو مطلب اهو آهي ته ڪا به ڪمپني يا استعمال ڪندڙ جنهن وٽ انهن پليٽ فارمن تائين رسائي آهي، ماڊل سان تجربا ڪرڻ ۽ ان کي مختلف حالتن ۾ لاڳو ڪرڻ شروع ڪري سگهي ٿو.

خاص مواد - هتي ڪلڪ ڪريو  گيما 3 اين: ڪنهن به ڊوائيس تي جديد AI آڻڻ لاءِ گوگل جو نئون منصوبو

ان جي ملٽي ماڊل اپروچ کي ڏنو ويو، Phi-4 آهي اهڙن شعبن تي ڌيان ڏنو ويو آهي جهڙوڪ:

  • مشيني ترجمو ۽ حقيقي وقت ۾ ذيلي عنوان.
  • ڪاروبار لاءِ دستاويز جي سڃاڻپ ۽ تجزيو.
  • ذهين مددگارن سان موبائل ايپليڪيشنون.
  • اي آءِ تي ٻڌل تدريس کي بهتر بڻائڻ لاءِ تعليمي ماڊل.

مائڪروسوفٽ ڏنو آهي هڪ ڪارڪردگي ۽ اسڪيل ايبلٽي تي ڌيان ڏيڻ سان انهن ماڊلز ۾ دلچسپ موڙ. ننڍي ٻولي جي ماڊلز (SLM) جي ميدان ۾ وڌندڙ مقابلي سان، فائي-4-ملٽي موڊل کي وڏن ماڊلز جي هڪ قابل عمل متبادل طور پيش ڪيو ويو آهي.، ڪارڪردگي ۽ پروسيسنگ جي صلاحيت جي وچ ۾ توازن پيش ڪندي گهٽ طاقتور ڊوائيسز تي به رسائي لائق.