Nvidia giới thiệu siêu chip AI Vera Rubin, nền tảng cho robot hình người

22/03/2025

Tại hội nghị GTC 2025, Nvidia đã công bố một loạt sản phẩm phần cứng và phần mềm mới, tập trung vào việc nâng cao khả năng của trí tuệ nhân tạo (AI). Sự kiện này diễn ra từ ngày 17 đến 21 tháng 3 tại San Jose, California, với bài phát biểu quan trọng của CEO Jensen Huang vào ngày 18 tháng 3, giới thiệu các sản phẩm chủ lực của công ty.

GPU Blackwell Ultra GB300

Chip đồ họa Blackwell Ultra GB300 dự kiến sẽ ra mắt vào cuối năm nay, là phiên bản nâng cấp từ chip Blackwell năm 2024. Mặc dù vẫn giữ nguyên sức mạnh tính toán 20 petaflops AI, nhưng bộ nhớ HBM3e đã được nâng cấp từ 192 GB lên 288 GB. So với mẫu H100 ra mắt năm 2022, Blackwell Ultra có sức mạnh suy luận AI vượt trội hơn 1,5 lần, có khả năng xử lý 1.000 token mỗi giây, gấp 10 lần so với chip ba năm trước.

Chip AI Blackwell Ultra GB300. Ảnh: Nvidia

CEO Jensen Huang cho biết: “AI đã có những bước tiến vượt bậc. Các tác nhân AI hiện nay yêu cầu hiệu suất tính toán cao hơn rất nhiều. Chúng tôi đã thiết kế Blackwell Ultra để đáp ứng nhu cầu này, với khả năng thực hiện suy luận AI hiệu quả nhất hiện nay”.

Nvidia sẽ cung cấp chip mới theo cụm, bao gồm 72 GPU Blackwell Ultra và 36 CPU Nvidia Grace, có thể kết nối với nền tảng đám mây riêng Nvidia DGX Cloud, được quảng bá là giải pháp toàn diện cho các tác vụ AI.

Hệ thống nhỏ hơn mang tên B300 NVL16 cũng được giới thiệu, với khả năng suy luận nhanh hơn 11 lần so với thế hệ trước, cùng với khả năng tính toán cao hơn 7 lần và bộ nhớ lớn hơn 4 lần.

Các đối tác như Cisco, Dell, HP, Lenovo và Supermicro đã đặt hàng Blackwell Ultra, nhưng giá sản phẩm vẫn chưa được công bố.

Siêu chip Vera Rubin

Vera Rubin được nhấn mạnh là kiến trúc chip AI tiếp theo của Nvidia, dự kiến ra mắt vào năm 2026, trong khi phiên bản Rubin Ultra có thể xuất hiện vào năm 2027. Vera Rubin sẽ đạt hiệu năng lên tới 50 petaflops, trong khi Rubin Ultra kết hợp hai mẫu Vera Rubin để đạt hiệu năng 100 petaflops. Các hệ thống này hứa hẹn sẽ nâng cao khả năng suy luận AI lên một tầm cao mới.

CEO Nvidia Jensen Huang giới thiệu Vera Rubin trên sân khấu sự kiện. Ảnh: The Verge

Cụm NVL576 của Rubin Ultra sẽ có hiệu năng gấp 14 lần so với cụm Blackwell Ultra, và sẽ được thiết kế trong giá đỡ máy chủ làm mát bằng chất lỏng mới mang tên Kyber Rack.

Nvidia cũng đã lên kế hoạch cho một kiến trúc mới hơn mang tên Feynman, dự kiến phát hành vào năm 2028, nhưng chưa công bố chi tiết về kiến trúc này.

Máy tính cá nhân AI DGX

DGX được giới thiệu với hai phiên bản là DGX Spark và DGX Station, được xem là “siêu máy tính để bàn”. Sản phẩm này chạy chip Blackwell Ultra, giúp các nhà phát triển có thể chạy các mô hình AI lớn ngay tại nhà mà không cần đến các hệ thống lớn. Theo thông tin từ Reuters, đây được coi là một thách thức lớn đối với các sản phẩm PC, đặc biệt là máy Mac cao cấp của Apple.

Bo mạch chủ máy tính để bàn DGX Station tích hợp Blackwell Ultra của Nvidia. Ảnh: Nvidia

DGX Spark có khả năng xử lý tới 1.000 nghìn tỷ phép tính mỗi giây, hỗ trợ tinh chỉnh AI và suy luận với các mô hình lý luận AI mới nhất. DGX Station mạnh mẽ hơn với bộ nhớ 784 GB, giúp tăng tốc khối lượng công việc đào tạo và suy luận quy mô lớn.

Cả hai phiên bản DGX đều được sản xuất bởi các đối tác như Asus, Boxx, Dell, HP, Lambda và Supermicro, đã nhận đặt hàng và dự kiến giao hàng vào cuối năm nay, nhưng giá vẫn chưa được công bố.

Chip mạng quang tử silicon Spectrum-X và Quantum-X

Bộ đôi chip mạng quang tử silicon mới của Nvidia sẽ cho phép các trung tâm dữ liệu kết nối hàng triệu GPU trên nhiều địa điểm khác nhau, đồng thời giảm đáng kể mức tiêu thụ năng lượng. Spectrum-X giúp tăng tốc hiệu suất mạng AI lên 1,6 lần so với Ethernet truyền thống, trong khi Quantum-X là chip mạng 800 Gb/giây đầu tiên trên thế giới được thiết kế cho AI quy mô lớn.

Chip Quantum-X. Ảnh: Nvidia

Các mẫu chip mới này sử dụng bộ chuyển mạch Ethernet Spectrum-4 và BlueField-3 SuperNIC, mang lại hiệu suất cao nhất cho AI, máy học và xử lý ngôn ngữ tự nhiên. Quantum-X dự kiến sẽ có mặt vào cuối năm nay, trong khi Spectrum-X sẽ ra mắt vào năm 2026.

Phần mềm Dynamo

Nvidia Dynamo là nền tảng suy luận module mã nguồn mở với độ trễ thấp, phục vụ cho các mô hình AI tạo sinh trong môi trường phân tán. Phần mềm này cho phép mở rộng quy mô liền mạch đối với khối lượng công việc suy luận GPU lớn, đồng thời tối ưu hóa quản lý bộ nhớ và truyền dữ liệu. Mục tiêu là tăng tốc quá trình suy luận, giúp các mô hình AI có thể “suy nghĩ” để trả lời các câu hỏi phức tạp.

Dynamo hỗ trợ tất cả các nền tảng AI suy luận và tối ưu hóa các mô hình ngôn ngữ lớn phổ biến, bao gồm cả DeepSeek-R1 và Llama. Phần mềm này sẽ được phát hành miễn phí.

Nvidia Isaac GR00T N1

GR00T N1 là mô hình được thiết kế cho robot hình người, được coi là “nền tảng robot hình người mở đầu tiên trên thế giới”. Nó được trang bị hệ thống “kép” giúp robot có thể suy nghĩ nhanh và chậm, tương tự như các mô hình AI lý luận. Hệ thống này cho phép robot thực hiện các tác vụ phức tạp như cầm nắm, di chuyển đồ vật và thực hiện các tác vụ nhiều bước.

CEO Nvidia Jensen Huang đứng cạnh robot Blue chạy GR00T N1 trên sân khấu sự kiện. Ảnh: Nvidia

Các nhà phát triển robot hình người như Agility Robotics, Boston Dynamics, Mentee Robotics và NEURA Robotics đã tiếp cận sớm với GR00T N1, dự kiến sẽ công bố vào cuối năm nay.

Để lại một bình luận

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *