மைக்ரோசாஃப்ட் ஃபை-4 மல்டிமோடல்: குரல், படங்கள் மற்றும் உரையைப் புரிந்துகொள்ளும் AI

கடைசியாக புதுப்பிக்கப்பட்டது: 27/02/2025
ஆசிரியர்: ஆல்பர்டோ நவரோ

  • மைக்ரோசாப்ட் நிறுவனம் Phi-4-மல்டிமாடல் என்ற AI மாதிரியை அறிமுகப்படுத்துகிறது, இது குரல், படங்கள் மற்றும் உரையை ஒரே நேரத்தில் செயலாக்குகிறது.
  • 5.600 பில்லியன் அளவுருக்களுடன், இது குரல் மற்றும் பார்வை அங்கீகாரத்தில் பெரிய மாதிரிகளை விஞ்சுகிறது.
  • சொல் செயலாக்கப் பணிகளில் மட்டுமே கவனம் செலுத்தும் பதிப்பான Phi-4-mini ஐ உள்ளடக்கியது.
  • Azure AI Foundry, Hugging Face மற்றும் NVIDIA ஆகியவற்றில் கிடைக்கிறது, வணிகம் மற்றும் கல்வியில் பல்வேறு பயன்பாடுகளுடன்.
Phi-4 மல்டிமாடல்-0 என்றால் என்ன?

மல்டிமாடல் ஃபை-4 உடன் மொழி மாதிரிகள் உலகில் மைக்ரோசாப்ட் ஒரு படி முன்னேறியுள்ளது., அதன் சமீபத்திய மற்றும் மிகவும் மேம்பட்ட செயற்கை நுண்ணறிவு, உரை, படங்கள் மற்றும் குரலை ஒரே நேரத்தில் செயலாக்கும் திறன் கொண்டது. இந்த மாதிரி, Phi-4-mini உடன் சேர்ந்து, ஒரு சிறிய மாதிரிகளின் திறனில் பரிணாமம் (SLM), பெரிய அளவிலான அளவுருக்கள் தேவையில்லாமல் செயல்திறன் மற்றும் துல்லியத்தை வழங்குகிறது.

Phi-4-மல்டிமாடலின் வருகை மைக்ரோசாப்ட் நிறுவனத்திற்கு ஒரு தொழில்நுட்ப முன்னேற்றத்தை மட்டுமல்ல, இது கூகிள் மற்றும் ஆந்த்ரோபிக் போன்ற பெரிய மாடல்களுடன் நேரடியாக போட்டியிடுகிறது.. அதன் உகந்த கட்டமைப்பு மற்றும் மேம்பட்ட பகுத்தறிவு திறன்கள் அதை உருவாக்குகின்றன பல பயன்பாடுகளுக்கு ஒரு கவர்ச்சிகரமான விருப்பம்., இயந்திர மொழிபெயர்ப்பிலிருந்து படம் மற்றும் குரல் அங்கீகாரம் வரை.

பிரத்தியேக உள்ளடக்கம் - இங்கே கிளிக் செய்யவும்  ஜெமினியின் புதிய மெட்டீரியல் யூ விட்ஜெட்டுகள் ஆண்ட்ராய்டில் வருகின்றன.

Phi-4-மல்டிமாடல் என்றால் என்ன, அது எப்படி வேலை செய்கிறது?

ஃபை-4 மைக்ரோசாப்ட்

Phi-4-மல்டிமோடல் என்பது மைக்ரோசாப்ட் உருவாக்கிய ஒரு AI மாதிரியாகும், இது உரை, படங்கள் மற்றும் குரலை ஒரே நேரத்தில் செயலாக்க முடியும்.. ஒற்றை முறையுடன் செயல்படும் பாரம்பரிய மாதிரிகளைப் போலன்றி, இந்த செயற்கை நுண்ணறிவு பல்வேறு தகவல் ஆதாரங்களை ஒரே பிரதிநிதித்துவ இடத்தில் ஒருங்கிணைக்கிறது, குறுக்கு கற்றல் நுட்பங்களைப் பயன்படுத்துவதற்கு நன்றி.

இந்த மாதிரி ஒரு கட்டமைப்பின் அடிப்படையில் கட்டமைக்கப்பட்டுள்ளது 5.600 பில்லியன் அளவுருக்கள், பல்வேறு வகையான தரவுகளை ஒன்றிணைக்க LoRAs (குறைந்த-தர தழுவல்கள்) எனப்படும் நுட்பத்தைப் பயன்படுத்துகிறது. இது மொழி செயலாக்கத்தில் அதிக துல்லியத்தையும் சூழலின் ஆழமான விளக்கத்தையும் அனுமதிக்கிறது.

முக்கிய திறன்கள் மற்றும் நன்மைகள்

உயர் மட்ட செயற்கை நுண்ணறிவு தேவைப்படும் பல முக்கிய பணிகளில் Phi-4-மல்டிமோடல் குறிப்பாக பயனுள்ளதாக இருக்கும்:

  • பேச்சு அங்கீகாரம்: இது டிரான்ஸ்கிரிப்ஷன் மற்றும் இயந்திர மொழிபெயர்ப்பு சோதனைகளில் WhisperV3 போன்ற சிறப்பு மாதிரிகளை விஞ்சுகிறது.
  • பட செயலாக்கம்: இது ஆவணங்கள், கிராபிக்ஸ் ஆகியவற்றை மிகத் துல்லியமாக விளக்குவதற்கும், OCR ஐச் செய்வதற்கும் திறன் கொண்டது.
  • குறைந்த தாமத அனுமானம்: இது செயல்திறனை தியாகம் செய்யாமல் மொபைல் மற்றும் குறைந்த சக்தி சாதனங்களில் இயங்க அனுமதிக்கிறது.
  • முறைகளுக்கு இடையே தடையற்ற ஒருங்கிணைப்பு: உரை, பேச்சு மற்றும் படங்களை ஒன்றாகப் புரிந்துகொள்ளும் அவர்களின் திறன் அவர்களின் சூழல் சார்ந்த பகுத்தறிவை மேம்படுத்துகிறது.
பிரத்தியேக உள்ளடக்கம் - இங்கே கிளிக் செய்யவும்  AMD மற்றும் ஸ்டெபிலிட்டி AI, Amuse 3.1 உடன் மடிக்கணினிகளில் உள்ளூர் AI ரெண்டரிங்கில் புரட்சியை ஏற்படுத்துகின்றன.

மற்ற மாடல்களுடன் ஒப்பீடு

PHI-4-மல்டிமாடல் செயல்திறன்

செயல்திறனைப் பொறுத்தவரை, Phi-4-மல்டிமாடல் பெரிய மாடல்களுக்கு இணையாக நிரூபிக்கப்பட்டுள்ளது. ஜெமினி-2-ஃப்ளாஷ்-லைட் மற்றும் கிளாட்-3.5-சோனட்டுடன் ஒப்பிடும்போது, மல்டிமாடல் பணிகளில் இதே போன்ற முடிவுகளை அடைகிறது, அதே நேரத்தில் அதன் சிறிய வடிவமைப்பின் காரணமாக சிறந்த செயல்திறனைப் பராமரிக்கிறது.

எனினும், குரல் அடிப்படையிலான கேள்விகள் மற்றும் பதில்களில் சில வரம்புகளை முன்வைக்கிறது, GPT-4o மற்றும் Gemini-2.0-Flash போன்ற மாதிரிகள் ஒரு நன்மையைக் கொண்டுள்ளன. இது அதன் சிறிய மாதிரி அளவு காரணமாகும், இது உண்மை அறிவைத் தக்கவைத்துக்கொள்வதைப் பாதிக்கிறது. எதிர்கால பதிப்புகளில் இந்த திறனை மேம்படுத்த முயற்சிப்பதாக மைக்ரோசாப்ட் சுட்டிக்காட்டியுள்ளது.

ஃபை-4-மினி: ஃபை-4-மல்டிமாடலின் சிறிய சகோதரர்

Phi-4-மல்டிமாடலுடன், மைக்ரோசாப்ட் மேலும் அறிமுகப்படுத்தியுள்ளது ஃபை-4-மினி, குறிப்பிட்ட உரை அடிப்படையிலான பணிகளுக்கு உகந்ததாக்கப்பட்ட ஒரு மாறுபாடு. இந்த மாதிரி வழங்க வடிவமைக்கப்பட்டுள்ளது இயற்கை மொழி செயலாக்கத்தில் உயர் செயல்திறன், இது சாட்பாட்கள், மெய்நிகர் உதவியாளர்கள் மற்றும் துல்லியமான புரிதல் மற்றும் உரை உருவாக்கம் தேவைப்படும் பிற பயன்பாடுகளுக்கு ஏற்றதாக அமைகிறது.

கிடைக்கும் தன்மை மற்றும் பயன்பாடுகள்

Phi-4 மல்டிமாடல்-5 என்றால் என்ன?

மைக்ரோசாப்ட், Phi-4-மல்டிமாடல் மற்றும் Phi-4-மினி ஆகியவற்றை டெவலப்பர்களுக்குக் கிடைக்கச் செய்துள்ளது. Azure AI ஃபவுண்டரி, ஹக்கிங் ஃபேஸ் மற்றும் NVIDIA API பட்டியல். இதன் பொருள், இந்த தளங்களை அணுகக்கூடிய எந்தவொரு நிறுவனமோ அல்லது பயனரோ, மாதிரியைப் பரிசோதித்துப் பார்த்து, வெவ்வேறு சூழ்நிலைகளில் அதைப் பயன்படுத்தத் தொடங்கலாம்.

பிரத்தியேக உள்ளடக்கம் - இங்கே கிளிக் செய்யவும்  ஜெம்மா 3n: எந்தவொரு சாதனத்திற்கும் மேம்பட்ட AI ஐக் கொண்டுவருவதற்கான கூகிளின் புதிய முயற்சி.

அதன் பன்முக அணுகுமுறையைக் கருத்தில் கொண்டு, Phi-4 என்பது போன்ற துறைகளை இலக்காகக் கொண்டது:

  • இயந்திர மொழிபெயர்ப்பு மற்றும் நிகழ்நேர வசன வரிகள்.
  • வணிகங்களுக்கான ஆவண அங்கீகாரம் மற்றும் பகுப்பாய்வு.
  • அறிவார்ந்த உதவியாளர்களுடன் மொபைல் பயன்பாடுகள்.
  • AI அடிப்படையிலான கற்பித்தலை மேம்படுத்துவதற்கான கல்வி மாதிரிகள்.

மைக்ரோசாப்ட் ஒரு வழங்கியுள்ளது செயல்திறன் மற்றும் அளவிடுதல் ஆகியவற்றில் கவனம் செலுத்துவதன் மூலம் இந்த மாதிரிகளுடன் சுவாரஸ்யமான திருப்பம். சிறிய மொழி மாதிரிகள் (SLM) துறையில் அதிகரித்து வரும் போட்டியுடன், பெரிய மாடல்களுக்கு சாத்தியமான மாற்றாக Phi-4-மல்டிமோடல் வழங்கப்படுகிறது., செயல்திறன் மற்றும் செயலாக்க திறனுக்கு இடையில் சமநிலையை வழங்குகிறது குறைந்த சக்தி வாய்ந்த சாதனங்களில் கூட அணுகக்கூடியது.