Tin mới

ARM "khai tử" vi xử lý Cortex, ra mắt thiết kế CPU C1 và GPU G1 mới

ARM giới thiệu lõi CPU C1 và GPU G1 với quy tắc đặt tên mới, bỏ tên "Cortex"

ARM vừa công bố thiết kế CPU và GPU thế hệ tiếp theo, đồng thời cũng đang tiến hành đổi mới thương hiệu – CPU ARM C1 và GPU G1, hai sản phẩm sẽ hình thành nên hệ thống tính toán ARM Lumex (CSS). “Lumex” là thương hiệu mới mà ARM sẽ sử dụng cho các thiết kế tập trung vào thiết bị di động (với các thiết kế khác, “Niva” sẽ được sử dụng cho PC, “Zena” cho ô tô, v.v.).

Thế hệ thiết kế CPU và GPU này mang lại những cải tiến đáng kể cho khối lượng công việc phổ biến (AI, dò tia), đồng thời cũng mang lại những cải tiến đáng kể cho khối lượng công việc nền hơn. Lưu ý rằng ARM cũng đã tạo ra một chipset có thể tùy chỉnh, có thể được cấp phép và sản xuất tại các xưởng đúc 3nm khác nhau.

Sau khi loại bỏ Cortex, các dòng chip Cortex cũ sẽ được đổi tên như sau:

  • Cortex-X9xx → ARM C1-Ultra
  • (Mới) ARM C1-Premium
  • Cortex-A7xx → ARM C1-Pro
  • Cortex-A5xx → ARM C1-Nano

Các lõi C1 mới là những nhân đầu tiên được xây dựng trên kiến ​​trúc ARMv9.3. Tất cả đều hỗ trợ Scalable Matrix Extension 2 (SME2) của ARM, giúp tăng tốc khối lượng công việc AI, đồng thời cải thiện các tác vụ thông thường hơn – ví dụ, việc giải mã video HDR hiệu quả hơn 10% với SME2. ARM C1-Ultra tập trung vào việc tăng Số lệnh trên mỗi chu kỳ (IPC). Trong các tác vụ đơn luồng, C1-Ultra nhanh hơn tới 25% so với Cortex-X925.

ARM cũng giới thiệu một lõi CPU thế hệ mới, ARM C1-Premium . Lõi này nhắm đến các thiết kế cận flagship – có diện tích bề mặt nhỏ hơn 35% so với Ultra (có nghĩa là chip sử dụng lõi này sẽ rẻ hơn), mang lại hiệu suất diện tích tốt nhất trong phân khúc (tức là hiệu suất trên mỗi mm² silicon).

Lõi ARM C1-Pro sẽ được sử dụng cho các tác vụ nặng liên tục trong chip hiệu năng cao và là lõi chính cho các thiết kế tầm trung. So với Cortex-A725, lõi này có thể mang lại hiệu suất cao hơn tới 16% trong các tác vụ như chơi game. Ngoài ra, nó có thể tiết kiệm điện năng hơn tới 12% khi phát video, duyệt web và sử dụng mạng xã hội. Những thay đổi trên ARM C1-Nano gần như hoàn toàn tập trung vào hiệu suất năng lượng – lõi nhỏ bé này tiết kiệm năng lượng hơn tới 26% so với Cortex-A520. Nó cũng mang lại cải tiến hiệu suất khiêm tốn và có diện tích lõi nhỏ hơn 2%.

Các lõi CPU sẽ được điều phối bởi Bộ chia sẻ C1-DynamIQ (DSU) mới. Bộ chia sẻ này chịu trách nhiệm chia sẻ bộ nhớ đệm L3 giữa tất cả các lõi, quản lý năng lượng cho các lõi, v.v. DSU mới cho phép tiết kiệm điện năng lên đến 26% so với DSU-120 trước đây. Cụm CPU ARM C1 có thể được cấu hình từ 1 lõi CPU đến tối đa 14 lõi. Các nhà thiết kế chipset có thể kết hợp tối đa ba loại lõi, lựa chọn giữa Ultra, Premium, Pro và Nano.

ARM tuyên bố rằng đối với khối lượng công việc thực tế, cụm CPU C1 mang lại hiệu suất cao hơn trung bình 30% trên các điểm chuẩn hàng đầu trong ngành và tăng tốc trung bình 15% cho các tác vụ như chơi game và phát trực tuyến video. Ngoài ra, nó sử dụng ít hơn trung bình 12% năng lượng cho các tác vụ như phát video, duyệt web và mạng xã hội so với các CPU thế hệ trước.

Như đã đề cập ở trên, lõi C1 mới cho phép cải thiện hiệu suất đáng kể cho AI thông qua phần mở rộng SME2 với độ trễ thấp hơn tới 4,7 lần cho Whisper Base (một mô hình Nhận dạng Giọng nói Tự động, tức là chuyển giọng nói thành văn bản). Hiệu suất AI cao hơn 4,7 lần cho mô hình Gemma 3 của Google và tốc độ tạo âm thanh nhanh hơn 2,8 lần cho Stability AI (một mô hình chuyển văn bản thành âm thanh có thể tạo âm thanh nền, nhạc và nhiều hơn nữa).

Các nhà phát triển ứng dụng sẽ nhận được hiệu suất được cải thiện "miễn phí" trên phần cứng thế hệ tiếp theo vì hỗ trợ SME2 được tích hợp vào các khuôn khổ AI chính từ ARM, Google, Microsoft, Alibaba và Meta.

Theo một nghiên cứu gần đây, có tới 83% game thủ chơi trên thiết bị di động. Đây là một ngành kinh doanh béo bở, cả về mặt trò chơi lẫn phần cứng. ARM cho biết họ đã xuất xưởng hơn 12 tỷ GPU cho đến nay – và đây là những GPU mạnh nhất mà họ từng thiết kế. ARM Mali G1-Ultra giới thiệu Bộ dò tia thế hệ thứ hai (RTUv2), giúp tăng gấp đôi hiệu suất dò tia so với hiệu suất bên trong GPU Immortalis-G925.

Lưu ý rằng việc render một cảnh game không chỉ đơn thuần là dò tia, vì vậy có thể mong đợi tốc độ khung hình cao hơn 40% trong các game sử dụng dò tia phần cứng. Ngoài ra, RTUv2 giờ đây là một mô-đun riêng biệt và mang đến một số tối ưu hóa hiệu quả năng lượng, bao gồm một tính năng đơn giản - nó có thể chuyển sang chế độ ngủ khi hệ thống ở chế độ nhàn rỗi.

Ngoài tính năng dò tia, Mali G1-Ultra có thể mang lại hiệu suất raster cao hơn 20% so với G925 trên các chuẩn benchmark hàng đầu. Nó cũng có thể tiết kiệm điện năng hơn 9%. GPU cũng có thể được sử dụng cho AI và nhờ đường dẫn tính toán ma trận GP16 hoàn toàn mới, G1-Ultra nhanh hơn 20% trong suy luận AI.

GPU ARM Mali-G1 có thể được cấu hình với từ 1 đến 24 lõi shader. GPU G1 hỗ trợ công nghệ Accuracy Super Resolution (ASR) của ARM, một công nghệ nâng cấp thời gian (tương tự DLSS) của công ty. Công nghệ này đã được Unreal Engine 5 hỗ trợ và tích hợp vào Fortnite.

Tất nhiên, hiện tại bạn vẫn chưa có điện thoại thông minh nào sử dụng CPU C1 và GPU G1. ARM cho biết phần cứng thế hệ tiếp theo sẽ "có mặt trên các thiết bị tiêu dùng trong tương lai rất gần".

Trường Giang