Nvidia Tăng Cường Sức Mạnh Cho DeepSeek
Trong một thông điệp mạnh mẽ tại hội nghị GTC diễn ra ở San Jose, California, CEO Jensen Huang đã công bố rằng các sản phẩm mới của Nvidia sẽ mang lại sự cải thiện đáng kể cho hiệu suất của mô hình R1 của DeepSeek. Điều này không chỉ khẳng định vị thế của Nvidia trong lĩnh vực trí tuệ nhân tạo mà còn phản ánh cuộc cạnh tranh công nghệ giữa Mỹ và Trung Quốc đang diễn ra ngày càng gay gắt.
Huang đã giải thích rằng các công nghệ mới nhất của Nvidia có khả năng nâng cao khả năng suy luận cho các mô hình lớn như R1 của DeepSeek, mở ra những cơ hội mới cho các ứng dụng AI trong tương lai.
Huang đã giới thiệu Dynamo, phần mềm suy luận mã nguồn mở mới của Nvidia, được ví như “hệ điều hành cho một nhà máy AI”. Dynamo có khả năng cung cấp hiệu suất cao hơn gấp 30 lần trên các đơn vị xử lý đồ họa (GPU) hiện có, giúp tối ưu hóa các tác vụ suy luận AI.
Trước đó, vào tháng 1, vai trò của Nvidia trong cuộc chiến AI toàn cầu đã bị đặt dấu hỏi khi DeepSeek công bố các mẫu mô hình hiệu suất cao với giá thành thấp. Điều này đã khiến nhiều người nghi ngờ về giá trị thực sự của các chip AI đắt tiền.
Nvidia đã điều chỉnh các con chip của mình để tiếp tục phục vụ thị trường Trung Quốc, mặc dù công ty này không được phép bán chip tiên tiến cho quốc gia này do các quy định xuất khẩu của Mỹ. Điều này đã gián tiếp tạo ra những bước đột phá cho DeepSeek.
Trong bối cảnh căng thẳng chính trị gia tăng giữa Bắc Kinh và Washington, các nhà sản xuất chip Mỹ như Nvidia và AMD đã nhanh chóng hỗ trợ các mô hình của DeepSeek, cho thấy sự hợp tác mạnh mẽ trong ngành công nghiệp công nghệ.
Một bài viết gần đây từ Nvidia đã chỉ ra rằng hệ thống Nvidia DGX với tám GPU Blackwell có thể đạt tốc độ suy luận lên tới 253 token mỗi giây cho mỗi người dùng, và thông lượng tối đa có thể vượt quá 30.000 token mỗi giây cho mô hình DeepSeek-R1 với 671 tỷ tham số. Đáng chú ý, nhóm Nvidia đã cải thiện thông lượng cho mô hình R1 lên tới 36 lần kể từ tháng 1.
Tại hội nghị GTC năm nay, Huang đã trình chiếu một video so sánh giữa mô hình ngôn ngữ truyền thống của Meta và DeepSeek-R1. Mặc dù mô hình của Meta chỉ sử dụng 439 token nhưng không thể đưa ra câu trả lời chính xác, trong khi R1 sử dụng 8.559 token và đã đưa ra câu trả lời đúng sau khi phân tích nhiều tình huống khác nhau.
Huang cũng đã công bố các con chip mới, bao gồm Blackwell Ultra GPU, được tối ưu hóa cho các mô hình lý luận và dự kiến sẽ được phát hành vào cuối năm nay. Ông cũng tiết lộ về kiến trúc GPU Vera Rubin, bộ xử lý thế hệ tiếp theo dự kiến ra mắt vào năm 2026, cùng với kiến trúc Feynman dự kiến sẽ xuất hiện vào năm 2028. Các cập nhật khác bao gồm nghiên cứu về robot và điện toán lượng tử.
Thời Đại Của Robot
Trong bài phát biểu trước hàng nghìn người tham dự hội nghị phát triển trí tuệ nhân tạo, tỷ phú Jensen Huang đã nhấn mạnh rằng AI đang bước vào một “thời kỳ chuyển mình”. Ông đã phác thảo sự phát triển vượt bậc của AI trong suốt 10 năm qua, từ nhận thức và “tầm nhìn máy tính” đến AI tạo sinh, và giờ đây là AI tác nhân — hay AI có khả năng lý luận.
Huang cho biết AI hiện nay có khả năng hiểu bối cảnh và ý nghĩa của các yêu cầu, từ đó tạo ra câu trả lời một cách chính xác. Ông nhấn mạnh rằng sự phát triển này đã thay đổi cách thức tính toán truyền thống.
Ông cũng cho biết rằng làn sóng AI tiếp theo chính là robot, được thúc đẩy bởi cái gọi là “AI vật lý”. AI vật lý có khả năng hiểu các khái niệm như ma sát, quán tính, nguyên nhân và kết quả, cũng như tính bền vững của vật thể.
Huang nhấn mạnh rằng mỗi giai đoạn phát triển của AI đều mở ra những cơ hội thị trường mới cho tất cả các bên liên quan.
Chìa khóa cho AI vật lý là việc sử dụng dữ liệu tổng hợp, từ AI hoặc dữ liệu do máy tính tạo ra, để đào tạo mô hình. Huang cho biết AI cần những trải nghiệm kỹ thuật số để học hỏi, và tốc độ học hỏi của nó đang khiến việc sử dụng con người trong các vòng đào tạo trở nên lỗi thời.
Ông nhấn mạnh rằng công nghệ của Nvidia có thể hỗ trợ loại hình học tập này cho AI khi giải quyết các vấn đề theo từng bước.
Để đạt được mục tiêu này, Huang đã công bố Isaac GR00T N1, một mô hình nền tảng mã nguồn mở được thiết kế để hỗ trợ phát triển robot hình người. Isaac GR00T N1 sẽ được kết hợp với mô hình AI Cosmos đã được cập nhật để phát triển dữ liệu đào tạo mô phỏng cho robot.
Cuối cùng, Huang đã giới thiệu một công cụ vật lý mã nguồn mở dùng cho mô phỏng robot có tên là Newton, hiện đang được phát triển cùng với Google DeepMind và Disney Research. Một con robot nhỏ hình hộp tên là Blue đã xuất hiện trên sân khấu, thực hiện các lệnh của Huang và tạo ra sự phấn khích cho khán giả.
“Thời đại của robot tổng quát đã đến rồi”, Huang khẳng định, mở ra một chương mới trong lĩnh vực công nghệ và trí tuệ nhân tạo.