Google giới thiệu hai nền tảng mới cho robot

22/03/2025

Giới thiệu về hai nền tảng robot mới

Google vừa công bố hai mô hình mới từ DeepMind, bao gồm Gemini Robotics và Gemini Robotics-ER, với mục tiêu tạo ra một nền tảng chung cho các loại robot. Sự ra mắt này không chỉ đánh dấu bước tiến trong công nghệ robot mà còn mở ra nhiều cơ hội mới cho việc ứng dụng AI trong cuộc sống hàng ngày.

Gemini Robotics: Nền tảng đa năng cho robot

Được giới thiệu vào ngày 12/3, Gemini Robotics là một mô hình Vision-Language-Action (Thị giác – Ngôn ngữ – Hành động) giúp robot có khả năng tương tác với môi trường xung quanh một cách hiệu quả. Mô hình này cho phép robot nhận diện đồ vật, di chuyển trong không gian thực tế và thực hiện nhiều nhiệm vụ khác nhau, từ đơn giản đến phức tạp.

Một robot chạy Gemini Robotics. Ảnh: Google

Một robot hoạt động trên nền tảng Gemini Robotics. Ảnh: Google

Khả năng điều khiển và tương tác của Gemini Robotics

Phòng nghiên cứu AI của Google đã công bố một loạt video minh họa khả năng của Gemini Robotics. Các robot sử dụng nền tảng này có thể thực hiện các thao tác như gấp giấy, cất đồ vật vào hộp và nhiều nhiệm vụ khác chỉ bằng các câu lệnh đơn giản. Theo thông tin từ Google DeepMind, Gemini Robotics được thiết kế để hoạt động linh hoạt trên nhiều loại robot khác nhau, kết hợp giữa hình ảnh và hành động để thực hiện nhiệm vụ.

Tiến bộ trong khả năng thích ứng của robot

Mô hình mới này cũng cho thấy sự tiến bộ trong khả năng thích ứng với các tình huống khác nhau, điều mà nhiều mô hình trước đây chưa làm được. Chẳng hạn, khi một vật thể bị rơi hoặc di chuyển, robot có thể nhanh chóng điều chỉnh hành động của mình để phù hợp với tình huống mới. Điều này rất quan trọng trong môi trường thực tế, nơi mà các yếu tố có thể thay đổi liên tục.

Ba phẩm chất cần thiết cho robot hiện đại

Google nhấn mạnh rằng các mô hình AI điều khiển robot hiện nay cần phải đáp ứng ba phẩm chất chính: tính linh hoạt, khả năng tương tác và sự khéo léo. Tính linh hoạt giúp robot thích ứng với nhiều tình huống khác nhau, trong khi khả năng tương tác cho phép robot hiểu và phản hồi nhanh chóng trước các lệnh hoặc thay đổi trong môi trường. Sự khéo léo là yếu tố quan trọng để robot có thể thực hiện các thao tác tinh vi mà con người thường làm.

Gemini Robotics-ER: Phiên bản nâng cao với khả năng nhận thức không gian

Mô hình thứ hai, Gemini Robotics-ER, được thiết kế với khả năng nhận thức không gian vượt trội. Điều này cho phép robot sử dụng khả năng suy luận thực tế để thực hiện các chương trình riêng biệt. Nền tảng này có thể cải thiện đáng kể khả năng của Gemini 2.0, bao gồm việc nhận diện hình ảnh 3D và tạo mã để thực hiện các hoạt động mới ngay lập tức.

Khả năng học hỏi từ con người

Ví dụ, khi robot nhìn thấy một cốc cà phê, nó có thể suy ra cách cầm cốc bằng hai ngón tay và thực hiện động tác đó một cách chính xác. Nếu việc tạo mã tự động không hiệu quả, robot sẽ quan sát và học hỏi từ thao tác của con người, từ đó tự áp dụng để tìm ra giải pháp. Điều này cho thấy khả năng học hỏi và thích ứng của robot đang ngày càng được cải thiện.

Định hướng an toàn cho robot

Gemini Robotics-ER cũng được thiết kế để tích hợp với các hệ thống an toàn hiện có, giúp đánh giá và phản hồi trong mọi tình huống. DeepMind đã công bố bộ dữ liệu Asimov và phát triển “hiến pháp robot” nhằm định hướng hành vi của robot theo hướng an toàn, đồng thời đánh giá tác động của các mô hình này đối với xã hội.

Hướng tới tương lai an toàn và hữu ích cho robot

Google DeepMind cho biết họ đang hợp tác với nhiều đối tác để xây dựng thế hệ robot hữu ích và an toàn hơn. Điều này không chỉ mang lại lợi ích cho ngành công nghiệp mà còn cho toàn xã hội, khi robot có thể hỗ trợ con người trong nhiều lĩnh vực khác nhau.

Thách thức trong phát triển robot hình người

Theo nghiên cứu của Goldman Sachs Research, phần cứng cho robot hình người đã gần hoàn thiện với các thành phần như camera, động cơ và cảm biến. Tuy nhiên, phần mềm vẫn chưa theo kịp sự phát triển của phần cứng. Một báo cáo khoa học cũng chỉ ra rằng “bộ não” và các chip AI mạnh nhất của robot hình người chiếm khoảng 80% giá trị của nó, tạo ra lợi thế lớn cho các công ty trong ngành.

Để lại một bình luận

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *