Cách cài đặt Microsoft Phi-4 Multimodal trên Windows 11

Cập nhật lần cuối: 02/03/2025
tác giả: Daniel Terrasa

Phi-4 Đa phương thức

Vài ngày trước trong blog này chúng tôi đã nhắc lại việc ra mắt Microsoft Phi-4 Đa phương thức, một mô hình trí tuệ nhân tạo đầy tham vọng được thiết kế để xử lý đồng thời văn bản, hình ảnh và giọng nói. Một bước đột phá đại diện cho một cột mốc quan trọng trong quá trình tiến hóa của AI, cho phép tương tác tự nhiên và hiệu quả hơn với các thiết bị. Bây giờ chúng ta hãy xem Cách cài đặt Phi-4 Multimodal trên Windows 11 và bắt đầu tận hưởng những lợi thế của nó.

Những thông tin chúng tôi mang đến cho bạn trong bài viết này sẽ rất hữu ích để tận dụng sức mạnh tuyệt vời của AI này. Tại đây bạn sẽ tìm thấy quy trình cài đặt chi tiết từng bước, từ các yêu cầu tối thiểu cho đến cấu hình và sử dụng.

Phi-4 Multimodal là gì và tại sao nó lại quan trọng?

Như Microsoft giải thích trong trang web chính thức, Phi-4 Đa phương thức Đây là mô hình trí tuệ nhân tạo tiên tiến nhất mà công ty đã tạo ra cho đến nay. Không giống như các phiên bản trước tập trung vào xử lý văn bản, phiên bản mới này kết hợp một phương pháp tiếp cận đa phương thức kết hợp văn bản, hình ảnh và giọng nói trong một hệ thống duy nhất.

Nội dung độc quyền - Bấm vào đây  Làm thế nào Alexa có thể được sử dụng để chơi trò chơi hoặc kể chuyện cười?

Cảm ơn tối ưu hóa kiến ​​trúc với 14.000 tỷ tham sốPhi-4 Multimodal đạt hiệu suất vượt trội trong các nhiệm vụ dịch máy, nhận dạng giọng nói và hỗ trợ đàm thoại. Nếu bạn muốn tìm hiểu thêm về các tính năng của công nghệ này, bạn có thể xem thêm thông tin chi tiết trong bài viết của chúng tôi dành riêng cho công nghệ này. Mô hình AI của Microsoft.

Yêu cầu tối thiểu để cài đặt Phi-4 Multimodal trên Windows 11

Trước khi tiến hành cài đặt, điều quan trọng là phải đảm bảo thiết bị của bạn đáp ứng các yêu cầu sau: yêu cầu:

  • Card đồ họa (GPU): Nên sử dụng RTX A6000 để có hiệu suất tối ưu.
  • Không gian đĩa: Ít nhất 40 GB dung lượng lưu trữ trống.
  • RAM: Khuyến nghị dung lượng tối thiểu là 48 GB.
  • Bộ xử lý (CPU): 48 lõi để thực hiện mượt mà.

Cách cài đặt Phi-4 Multimodal trên Windows 11

Cách cài đặt Microsoft Phi-4 Multimodal trên Windows 11

 

Dưới đây chúng tôi trình bày chi tiết từng bước quá trình cài đặt Microsoft Phi-4 Multimodal trên Windows 11:

1. Tải xuống và cài đặt Ollama

Ollama là nền tảng cho phép bạn chạy Phi-4 Multimodal trên máy tính cục bộ của bạn. Để cài đặt, điều đầu tiên cần làm là chạy lệnh sau trong cửa sổ lệnh Windows:

Nội dung độc quyền - Bấm vào đây  Anthropic tăng tốc đầu tư: 50.000 tỷ euro cho cơ sở hạ tầng và mở rộng tại Châu Âu

curl -fsSL https://ollama.com/install.sh | sh

2. Thiết lập môi trường

Sau khi Ollama được cài đặt, cần phải cấu hình môi trường phù hợp cho Phi-4 Multimodal. Điều này bao gồm Chọn đúng tài nguyên phần cứng và điều chỉnh cài đặt hệ thống.

3. Tải xuống và khởi chạy Phi-4 Multimodal

Sau khi hoàn tất cài đặt, để lấy được mô hình, chúng ta phải thực hiện lệnh sau trong terminal:

ollama pull vanilj/Phi-4

Sau khi tải xuống hoàn tất, chúng ta bắt đầu mô hình bằng:

ollama run vanilj/Phi-4

Sử dụng Phi-4 Multimodal trong Azure AI Foundry

xưởng đúc azure ai

Một lựa chọn khác để sử dụng Phi-4 Multimodal là thông qua nền tảng đám mây của Microsoft, Xưởng đúc Azure AI. Giải pháp thay thế này cho phép truy cập vào các khả năng của mô hình không cần cài đặt cục bộ.

Để triển khai Phi-4 Multimodal trên Azure, hãy làm theo các bước sau:

  1. Truy cập cổng thông tin Azure AI Foundry.
  2. Chọn tùy chọn triển khai mô hình đa phương thức Phi-4.
  3. Thực hiện theo hướng dẫn để thiết lập và sử dụng.

So sánh với các mô hình AI khác

 

Nội dung độc quyền - Bấm vào đây  Trí tuệ nhân tạo được ứng dụng như thế nào trong thể thao

Phi-4 Multimodal đã chứng minh một màn diễn xuất quá xuất sắc trong các nhiệm vụ xử lý ngôn ngữ tự nhiên và nhận dạng giọng nói. So với các mẫu như Gemini Pro và GPT-4o, ưu điểm của nó nằm ở hiệu quả cho phép bạn xử lý nhiều loại dữ liệu cùng lúc.

Trong các thử nghiệm chuẩn, Phi-4 Multimodal đã vượt trội hơn các mô hình tham chiếu trong các nhiệm vụ như:

  • Nhận dạng giọng nói tiên tiến.
  • Dịch máy có độ chính xác cao.
  • Tương tác đa phương thức theo thời gian thực.

Microsoft đã có bước tiến lớn với Phi-4 Multimodal, cung cấp cho người dùng một công cụ mạnh mẽ và linh hoạt, giúp định nghĩa lại tiềm năng của trí tuệ nhân tạo trong gia đình và doanh nghiệp. Việc cài đặt trên Windows 11 cho phép bạn tận dụng lợi thế của một mô hình tiên tiến tích hợp giọng nói, hình ảnh và văn bản với tính lưu động chưa từng có.