Summary

EN: AgiBot World Colosseo (IROS 2025 Finalist + IEEE TRO 2026, arXiv:2503.06669) is the largest public robot manipulation dataset to date, with 1M+ teleoperated trajectories (2,976 hours) across 217 tasks, 87 skills, and 106 scenes using humanoid robots. It introduces the GO-1 generalist policy (latent action representations) achieving 30% improvement over Open-X pretrained policies and 60%+ success on complex tasks. Quality is enforced via multi-stage human-in-the-loop verification. Released in two tiers: Alpha (92k curated, 8.5T tokens) and Beta (1M full, 43.8T tokens).

ZH (繁體中文): AgiBot World Colosseo(IROS 2025 最佳論文候選 + IEEE TRO 2026,arXiv:2503.06669)是目前規模最大的公開機器人操作資料集,包含 100 萬筆以上遙操作示範(2,976 小時),橫跨 217 個任務、87 種技能、106 個場景,使用人形機器人收集。配套推出 GO-1 泛化策略(潛在動作表示),在複雜任務上比 Open-X 預訓練策略高 30%、比 RDT 方案高 32%,複雜任務成功率超過 60%。資料分兩級釋出:Alpha 精選子集(92k 筆,8.5T tokens)和 Beta 完整版(103 萬筆,43.8T tokens)。

Key Insights

  • Insight 1 — 數量級跳躍的意義:從 DROID 的 76k 到 AgiBot 的 1M+ 是 13 倍的規模提升;這種規模可能觸發類似 LLM 的湧現能力(複雜任務泛化),而非線性改善。
  • Insight 2 — 品質控制是差異化競爭點:在 1M 規模下維持品質的關鍵是多階段人工驗證流水線,而非依賴後處理過濾,這是 AgiBot World 相較 Open-X(聚合異構資料)的設計優勢。
  • Insight 3 — 中國機器人生態系統的進入:AgiBot World 代表中國機器人公司(AgiBot/前智源機器人)進入大規模預訓練資料競賽,類似 Open-X 的中國版本,且規模已超越。
  • Insight 4 — 潛在動作表示的創新:GO-1 使用潛在動作空間(而非顯式 joint/EE 動作)學習策略,這是一個值得關注的架構創新,可能影響後續 VLA 設計。

Connections