Como instalar Microsoft Phi-4 Multimodal en Windows 11

Última actualización: 02/03/2025

Multimodal Phi-4

Hai uns días neste blog facíamos eco do lanzamento de Microsoft Phi-4 Multimodal, un ambicioso modelo de intelixencia artificial deseñado para procesar texto, imaxes e voz simultaneamente. Un avance que representa a fito significativo na evolución da IA, permitindo interaccións máis naturais e eficientes cos dispositivos. Agora imos ver Como instalar Phi-4 Multimodal en Windows 11 e comeza a gozar das súas vantaxes.

A información que che traemos neste artigo será moi útil para aproveitar o gran poder desta IA. Aquí atoparás o proceso de instalación detallado paso a paso, desde os requisitos mínimos ata a configuración e o uso.

Que é Phi-4 Multimodal e por que é relevante?

Como explica Microsoft no seu sitio web oficial, Multimodal Phi-4 É o modelo de intelixencia artificial máis avanzado que a compañía creou ata a data. A diferenza das anteriores versións centradas no procesador de textos, esta nova versión incorpora un enfoque multimodal que combina texto, imaxes e voz nun único sistema.

Contido exclusivo - Fai clic aquí  Como se pode usar Alexa para xogar ou contar chistes?

Grazas á súa arquitectura optimizada con 14.000 mil millóns de parámetrosPhi-4 Multimodal logra un rendemento destacado nas tarefas de tradución automática, recoñecemento de voz e asistencia conversacional. Se queres saber máis sobre as características desta tecnoloxía, podes consultar máis detalles no noso artigo dedicado a ela. Modelo Microsoft AI.

Requisitos mínimos para instalar Phi-4 Multimodal en Windows 11

Antes de proceder á instalación, é fundamental asegurarse de que o seu equipo cumpra os seguintes requisitos: requisitos:

  • Tarxeta gráfica (GPU): Recoméndase RTX A6000 para un rendemento óptimo.
  • Espazo en disco: polo menos 40 GB de almacenamento gratuíto.
  • RAM: Recoméndase un mínimo de 48 GB.
  • Procesador (CPU): 48 núcleos para unha execución suave.

Como instalar Phi-4 Multimodal en Windows 11

Como instalar Microsoft Phi-4 Multimodal en Windows 11

 

A continuación detallamos o proceso de instalación de Microsoft Phi-4 Multimodal en Windows 11 paso a paso:

1. Descarga e instala Ollama

Ollama é a plataforma que che permite executar Phi-4 Multimodal no teu ordenador local. Para instalalo, o primeiro que hai que facer é executar o seguinte comando no terminal de Windows:

Contido exclusivo - Fai clic aquí  Anthropic acelera o seu investimento: 50.000 millóns de euros para infraestruturas e expansión en Europa

curl -fsSL https://ollama.com/install.sh | sh

2. Configura o ambiente

Unha vez instalado Ollama, é necesario configurar o ambiente axeitado para Phi-4 Multimodal. Isto inclúe Selección dos recursos de hardware adecuados e axustar a configuración do sistema.

3. Descarga e inicia Phi-4 Multimodal

Unha vez completada a configuración, para obter o modelo debemos executar o seguinte comando no terminal:

ollama pull vanilj/Phi-4

Unha vez completada a descarga, iniciamos o modelo con:

ollama run vanilj/Phi-4

Usando Phi-4 Multimodal en Azure AI Foundry

fundición azure ai

Outra opción para usar Phi-4 Multimodal é a través da plataforma na nube de Microsoft, Azure AI Foundry. Esta alternativa permite acceder ás capacidades do modelo non se precisa instalación local.

Para implementar Phi-4 Multimodal en Azure, siga estes pasos:

  1. Acceda ao portal de Azure AI Foundry.
  2. Seleccione a opción de implantación do modelo multimodal Phi-4.
  3. Siga as instrucións de configuración e uso.

Comparación con outros modelos de IA

 

Contido exclusivo - Fai clic aquí  Como se aplica a Intelixencia Artificial no deporte

Phi-4 Multimodal demostrou a desempeño sobresaliente en tarefas de procesamento da linguaxe natural e recoñecemento da fala. En comparación con modelos como Gemini Pro e GPT-4o, a súa vantaxe reside no eficiencia co que manexas varios tipos de datos simultaneamente.

Nas probas de referencia, Phi-4 Multimodal superou os modelos de referencia en tarefas como:

  • Recoñecemento de voz avanzado.
  • Tradución automática de alta precisión.
  • Interacción multimodal en tempo real.

Microsoft deu un gran paso adiante con Phi-4 Multimodal, ofrecendo aos usuarios unha ferramenta robusta e versátil que redefine o potencial da intelixencia artificial no fogar e na empresa. A súa instalación en Windows 11 permite aproveitar un modelo de última xeración que integra voz, imaxe e texto cun fluidez sen precedentes.