Google triển khai mô hình Gemini mới có thể chạy trên robot tại chỗ

gemini model for robots

Google vừa giới thiệu mô hình Gemini mới, cho phép robot thực hiện các nhiệm vụ phức tạp ngay tại chỗ mà không cần kết nối internet. Đây là bước tiến đáng chú ý khi hiệu suất của mô hình này tương đương với các hệ thống đám mây, đồng thời giảm độ trễ trong điều khiển. Tuy nhiên, việc ứng dụng thực tế và khả năng thích nghi của Gemini trong những môi trường đa dạng vẫn còn nhiều điểm cần khám phá.

Những điểm chính

  • Google ra mắt mô hình Gemini Robotics On-Device cho phép robot thực hiện nhiệm vụ phức tạp ngay tại chỗ mà không cần kết nối internet.
  • Mô hình mới tối ưu xử lý trực tiếp trên robot, giảm độ trễ và duy trì hiệu suất gần tương đương phiên bản đám mây.
  • Gemini Robotics vượt trội trong benchmark so với nhiều mô hình on-device khác và áp dụng cho các robot đa dạng như Franka FR3, Apollo humanoid.
  • Robot sử dụng Gemini có khả năng thích ứng nhanh với môi trường mới và hoàn thành nhiệm vụ phức tạp như lắp ráp công nghiệp.
  • SDK kèm theo giúp nhà phát triển huấn luyện robot nhanh chóng với 50-100 lần trình diễn và sử dụng trình mô phỏng MuJoCo.

Mặc dù đã có nhiều tiến bộ trong lĩnh vực robotics AI, Google DeepMind tiếp tục khẳng định vị thế bằng việc triển khai mô hình Gemini Robotics On-Device mới, cho phép các robot thực hiện các nhiệm vụ phức tạp ngay tại chỗ mà không cần kết nối internet, đồng thời duy trì hiệu suất gần tương đương với phiên bản chạy trên đám mây. Mô hình này phát triển dựa trên nền tảng của Gemini Robotics ra mắt vào tháng Ba, nhưng được tối ưu để xử lý trực tiếp trên thiết bị, từ đó tăng cường tính linh hoạt và giảm độ trễ trong quá trình điều khiển robot. Thay vì phụ thuộc hoàn toàn vào điện toán đám mây, Gemini Robotics On-Device có thể nhận lệnh bằng ngôn ngữ tự nhiên và điều khiển các động tác của robot một cách chính xác và nhanh chóng.

Google DeepMind cho biết Gemini Robotics On-Device vượt trội hơn nhiều mô hình on-device hiện có trong các bài kiểm tra benchmark tổng quát, dù không nêu rõ cụ thể các đối thủ cạnh tranh. Mô hình mới không chỉ thể hiện hiệu quả trên lý thuyết mà còn chứng minh khả năng áp dụng thực tiễn qua nhiều loại robot khác nhau, từ robot ALOHA ban đầu đến Franka FR3 và Apollo humanoid. Khả năng xử lý tại chỗ cho phép robot thích ứng nhanh với môi trường và những tình huống chưa từng gặp, như Franka FR3 có thể hoàn thành các nhiệm vụ phức tạp với vật thể mới lạ hoặc thực hiện lắp ráp trên dây chuyền công nghiệp.

Đi kèm với mô hình, Google cũng phát hành Gemini Robotics SDK, cung cấp công cụ để các nhà phát triển nhanh chóng huấn luyện robot thực hiện các nhiệm vụ mới chỉ với 50 đến 100 lần trình diễn, sử dụng trình mô phỏng vật lý MuJoCo. Điều này tạo điều kiện thuận lợi cho việc tùy biến và mở rộng ứng dụng robot trong nhiều lĩnh vực, từ công nghiệp đến dịch vụ. Sự xuất hiện của Gemini Robotics On-Device góp phần thúc đẩy xu hướng phát triển robotics AI với khả năng xử lý tại chỗ, giảm bớt phụ thuộc vào kết nối mạng, đồng thời mở rộng phạm vi ứng dụng thực tiễn của robot trong đời sống và sản xuất.