- Bộ tăng tốc Instinct MI350 mới của AMD mang lại hiệu suất suy luận nhanh hơn tới 35 lần và cải thiện đáng kể hiệu quả sử dụng điện năng.
- Cơ sở hạ tầng AI quy mô lớn với bộ xử lý MI350 và EPYC hiện đang được triển khai trên các đám mây siêu lớn như Oracle Cloud Infrastructure.
- Đột phá về phần mềm: ROCm 7 tối ưu hóa quá trình phát triển AI và hiện có sẵn cùng với nền tảng AMD Developer Cloud toàn cầu.
- Sự hợp tác với Meta, OpenAI, Microsoft và các công ty hàng đầu khác củng cố vị thế dẫn đầu của AMD trong hệ sinh thái AI mở.
AMD đã giới thiệu bộ tăng tốc Instinct MI350 mới của mình, nhằm mục đích đánh dấu một sự thay đổi trước và sau trong lĩnh vực trí tuệ nhân tạo tạo sinh và điện toán tiên tiến. Công ty, trong sự kiện Advancing AI 2025, đã nêu rõ mục tiêu của mình là thiết lập bản thân như một chuẩn mực về hiệu suất, hiệu quả và khả năng mở rộng cho các ứng dụng AI đòi hỏi khắt khe nhất. Chiến lược này, dựa trên các công nghệ và tiêu chuẩn mở, Ngoài ra, dự án còn tìm cách tạo điều kiện thuận lợi cho việc tích hợp phần cứng và phần mềm thông qua sự hợp tác với nhiều công ty hàng đầu trong ngành..
Với những bản phát hành này, AMD đặt mục tiêu trở thành một nhân tố chủ chốt trong việc tạo ra các hệ sinh thái AI mở và mạnh mẽ, có khả năng đáp ứng sự tăng trưởng theo cấp số nhân của các mô hình ngôn ngữ và thuật toán thế hệ tiếp theo. Thách thức là kết hợp các bộ tăng tốc cấp cao, bộ xử lý mạnh mẽ và một ngăn xếp phần mềm được tối ưu hóa, thúc đẩy quá trình dân chủ hóa các giải pháp trí tuệ nhân tạo dành cho cả các công ty lớn và các nhà phát triển độc lập.
Instinct MI350 ra mắt: bước nhảy vọt về hiệu suất và hiệu quả

Dòng sản phẩm Instinct MI350 mới bao gồm GPU MI350X và MI355X, hứa hẹn sẽ tăng gấp bốn lần sức mạnh tính toán trong các tác vụ trí tuệ nhân tạo so với thế hệ trước. Khi nói đến suy luận AI, bước nhảy vọt thậm chí còn đáng kể hơn, đạt tới 35 lần hiệu suất trước đó. Mô hình MI355X cũng nổi bật về tỷ lệ chất lượng-giá cả, cho phép đạt được tới Thêm 40% token cho mỗi đô la đầu tư so với đối thủ cạnh tranh.
Để đáp ứng nhu cầu của khối lượng công việc phức tạp nhất, Instinct MI350 tích hợp Bộ nhớ HBM288E 3 GB (do Micron và Samsung cung cấp) và cung cấp băng thông lên tới 8 TB/giâyCả hai tùy chọn làm mát bằng không khí và chất lỏng đều khả dụng, cho phép lắp đặt tối đa 64 GPU trong một giá đỡ truyền thống hoặc gấp đôi trong cấu hình làm mát bằng chất lỏng trực tiếp. Các số liệu hiệu suất đạt tới 2,6 exaFLOPS trong các hoạt động FP4/FP6.
Cơ sở hạ tầng toàn diện và khả năng mở rộng: đề xuất "Helios"

Một trong những trọng tâm chính là cơ sở hạ tầng mở quy mô lớn, Đang chạy trên các đám mây lớn như Oracle Cloud Infrastructure. Giải pháp này, sẽ có mặt vào nửa cuối năm 2025, kết hợp bộ tăng tốc Instinct MI350 với bộ xử lý AMD EPYC thế hệ thứ năm và card mạng Pensando Pollara.
Nhìn về phía trước, AMD đã xem trước "Helios", giá đỡ AI thế hệ tiếp theo của hãng, sẽ tích hợp GPU Instinct MI400, bộ xử lý EPYC "Venice" với kiến trúc Zen 6 và card mạng Pensando "Vulcan". Hiệu suất tăng khi chạy các mô hình AI dự kiến sẽ là Hỗn hợp các chuyên gia có thể cao hơn thế hệ hiện tại tới 10 lần.
Và trong phần mềm, AMD ra mắt ROCm 7, một phiên bản cải tiến được thiết kế để giải quyết những thách thức của AI tạo sinh và điện toán hiệu suất cao. Bản cập nhật này bao gồm những cải tiến cho hỗ trợ cho các khuôn khổ chuẩn, API mới, trình điều khiển và công cụ, mở rộng các lựa chọn cho nhà phát triển.
Hơn nữa, nền tảng Đám mây dành cho nhà phát triển AMD hiện đã có mặt trên toàn cầu, cung cấp môi trường được quản lý để phát triển dự án AI nhanh nhẹn và truy cập vào các tài nguyên tiên tiến.
Tăng cường hiệu quả năng lượng và tính bền vững
Một khía cạnh mà AMD đã nhấn mạnh là tối ưu hóa năng lượng. Các máy gia tốc MI350 đã vượt xa các mục tiêu nội bộ, đạt được cải thiện hiệu quả năng lượng lên đến 38 lần trong khoảng thời gian năm năm. Công ty cũng đặt mục tiêu tăng hiệu quả năng lượng quy mô giá đỡ vào năm 2030 lên gấp 20 lần so với năm 2024, điều này sẽ giúp đào tạo các mô hình AI hiện yêu cầu hàng trăm giá đỡ chỉ trên một giá đỡ dễ dàng hơn. giảm lượng điện tiêu thụ 95%.
Các liên minh chiến lược là trụ cột của AMD, với các công ty như Meta, OpenAI, Microsoft, Oracle, Cohere, Red Hat, HUMAIN, Astera Labs, Marvell và xAI thể hiện sự tự tin lớn vào công nghệ của họ. Meta đã sử dụng dòng MI300X trong các mô hình suy luận như Llama 3 và 4; OpenAI đang hợp tác chặt chẽ với AMD để tích hợp phần cứng và phần mềm vào cơ sở hạ tầng AI của mình; và Microsoft đã chạy các mô hình sản xuất trên Azure với nền tảng Instinct.
Oracle, trong khi đó, có kế hoạch triển khai lên đến 131.072 GPU MI355X để mở rộng các cụm zettascale của bạn, củng cố hệ sinh thái đối tác thúc đẩy việc áp dụng và phát triển các giải pháp AI.
Tầm nhìn của AMD không chỉ tập trung vào tốc độ và sức mạnh mà còn vào tính bền vững, tính cởi mở về công nghệ và xây dựng quan hệ đối tác chặt chẽ để đẩy nhanh sự phát triển của trí tuệ nhân tạo trên toàn cầu.
Tôi là một người đam mê công nghệ và đã biến sở thích “đam mê” của mình thành một nghề. Tôi đã dành hơn 10 năm cuộc đời mình để sử dụng công nghệ tiên tiến và mày mò đủ loại chương trình chỉ vì tò mò. Bây giờ tôi chuyên về công nghệ máy tính và trò chơi điện tử. Điều này là do trong hơn 5 năm, tôi đã viết cho nhiều trang web khác nhau về công nghệ và trò chơi điện tử, tạo ra các bài viết nhằm cung cấp cho bạn thông tin bạn cần bằng ngôn ngữ mà mọi người đều có thể hiểu được.
Nếu bạn có bất kỳ câu hỏi nào, kiến thức của tôi bao gồm mọi thứ liên quan đến hệ điều hành Windows cũng như Android dành cho điện thoại di động. Và cam kết của tôi là với bạn, tôi luôn sẵn sàng dành một vài phút và giúp bạn giải quyết mọi thắc mắc mà bạn có thể có trong thế giới internet này.
