Hugging Face vừa công bố SmolVLA, một mô hình robot thân thiện dành cho người dùng MacBook. Với 450 triệu tham số, SmolVLA nổi bật trong các tác vụ liên quan đến thị giác-ngôn ngữ-hành động. Mô hình này không chỉ giúp người dùng dễ dàng tương tác trong môi trường ảo và thực tế, mà còn mở ra cơ hội cho những ai muốn khám phá robotics mà không cần phần cứng đắt tiền. Điều gì sẽ xảy ra khi công nghệ trở nên dễ tiếp cận hơn?
Những điểm chính
- SmolVLA là mô hình AI robotics mới của Hugging Face, thiết kế đặc biệt để hoạt động trên MacBook.
- Mô hình có cấu trúc 450 triệu tham số, phù hợp với phần cứng tiêu dùng như GPU đơn.
- SmolVLA hỗ trợ xử lý đồng thời nhiều tác vụ khác nhau, tăng cường hiệu suất trong robotics.
- Người dùng có thể thử nghiệm SmolVLA với chi phí thấp, mở rộng khả năng tiếp cận cho nhiều người.
- Hệ sinh thái robotics của Hugging Face, bao gồm SmolVLA và LeRobot, khuyến khích sáng tạo và thử nghiệm trong cộng đồng.
Hugging Face đã giới thiệu SmolVLA, một mô hình AI dành cho robotics, mở ra cơ hội cho người dùng MacBook tham gia vào lĩnh vực này. Mô hình này được phát triển dựa trên dữ liệu được chia sẻ bởi cộng đồng với các giấy phép tương thích, cho thấy sự kết nối và hợp tác trong nghiên cứu AI. SmolVLA nổi bật với việc vượt trội hơn các mô hình lớn hơn trong cả môi trường ảo lẫn thực tế, nhắm đến việc dân chủ hóa quyền truy cập vào các mô hình vision-language-action (VLA).
SmolVLA có cấu trúc gồm 450 triệu tham số, cho phép xử lý đồng thời các tác vụ khác nhau thông qua stack inference không đồng bộ. Điều này có nghĩa là việc xử lý hành động có thể được tách biệt khỏi việc xử lý cảm biến, tạo điều kiện thuận lợi cho việc triển khai trên các phần cứng tiêu dùng như GPU đơn hoặc MacBook. Người dùng có thể thử nghiệm và triển khai mô hình này trên các thiết bị giá cả phải chăng, mở rộng khả năng tiếp cận cho nhiều người hơn.
SmolVLA với 450 triệu tham số cho phép xử lý đồng thời, mở ra cơ hội cho người dùng thử nghiệm trên thiết bị giá cả phải chăng.
Hệ sinh thái robotics của Hugging Face không chỉ dừng lại ở SmolVLA mà còn bao gồm LeRobot, một bộ sưu tập các mô hình robotics, dữ liệu và công cụ được ra mắt năm ngoái. Sự hợp tác gần đây với Pollen Robotics, một công ty khởi nghiệp về robotics tại Pháp, càng củng cố thêm nỗ lực của Hugging Face trong việc phát triển hệ thống robotics giá rẻ, bao gồm cả robot hình người, nhằm phục vụ cho các dự án tại nhà.
Người dùng đã bắt đầu thử nghiệm SmolVLA trên các hệ thống robotic của bên thứ ba, với những kết quả ấn tượng. Chẳng hạn, một người dùng đã điều khiển một Koch Arm bằng SmolVLA trên GPU RTX 2050, chỉ với 31 bản demo đã tinh chỉnh, đạt được hiệu suất tương đương hoặc cao hơn so với các mô hình chuyên biệt. Sự phản hồi tích cực từ cộng đồng qua mạng xã hội cho thấy tiềm năng lớn của mô hình này trong việc phát triển robotics.