Question

現有 vault 中有關於 robotic dataset 的 survey 嗎?(包括 survey、clippings、research notes 等)

Answer

Vault 中沒有以「robotic dataset」為主題的專屬 survey 論文,但相關內容分散在以下三個層次:

一、Research Notes(綜合分析)

最接近 dataset survey 的是:

  • research/robot-manipulation-unified-survey-2510-10903.md — 解析 arXiv 2510.10903,§7.1 專章討論各類資料收集方法(遙操作、人體示範、自動採集),並比較 LIBERO、Open-X 等 benchmark 的使用情境。這是 vault 中對「資料從哪來」覆蓋最廣的文件。
  • research/robotic-teleoperation-manipulation.md — 聚焦遙操作作為資料收集手段,涵蓋硬體比較與成本分析。
  • research/dexterous-hand-tactile-data-collection-devices-lfd.md — 靈巧手資料收集:資料手套、觸覺感測器、動作捕捉等設備的 LfD 應用。
  • research/human-demo-collection-simulation-across-domains.md — 跨域示範資料收集,含模擬器與真實環境的遷移問題。
  • research/lerobot-framework-tools-use-cases.md — LeRobot 框架下的標準化 dataset 格式(LeRobotDataset v3.0)。

二、Clippings(個別論文/系統)

以下 clippings 直接描述具體 dataset 或資料收集系統:

  • Clippings-rh20t-acomprehensive-robotic-dataset-for-learning-diverse-skills-in-one-shotRH20T(NeurIPS 2023 workshop):110K+ 機器人示範、6 自由度力矩感測、one-shot 技能學習。
  • Clippings-hoi-a-multimodal-dataset-for-force-grounded-cross-view-articulated-manipulationHoi! Dataset(ETH Zurich + TU Munich):3048 序列、381 個關節物件、多模態(視覺 + 力)。
  • Clippings-arcap-ar-robot-data-collection-systemARCap:AR 輔助的可攜式資料收集系統,解決傳統遙操作失敗模式。
  • Clippings-hommi-learning-whole-body-mobile-manipulation-from-human-demonstrationsHoMMI:全身移動操作資料收集框架(Stanford + Toyota)。
  • Clippings-lerobot-open-source-robot-learning-library-arxiv + Clippings-lerobot-v040-release-supercharging-oss-robot-learning — LeRobot 的 dataset 標準化生態。
  • Clippings-tracking-dexterous-hands-a-practitioners-guide-to-motion-capture-for-robot-learning — 動作捕捉用於靈巧手 LfD 的實務指南。

三、Q&A Notes(已回答問題)

  • notes/2026-04-05-robot-manipulation-data-collection-methods.md(7.9K)— 最詳盡:按「操作方式」×「感測模態」二維分類所有資料收集方法,含各方式對 IL 的影響分析。
  • notes/2026-04-05-2510-10903-data-quality-evaluation.md(5.8K)— 資料品質評估:如何判斷示範資料好壞。
  • notes/2026-04-05-gaussian-splatting-robot-data-collection.md(2.6K)— Gaussian Splatting 作為合成資料生成手段。

四、覆蓋缺口

Vault 中尚無以下大型 dataset 的專屬筆記:

  • Open-X Embodiment / RT-X(Google DeepMind 的跨機器人大規模 dataset)
  • DROID(Berkeley 的遙操作 dataset)
  • BridgeData v2
  • AgiBot-World(討論過但未存成獨立 vault note)

Sources

Vault notes consulted:

Follow-up Questions

  • 是否要針對 Open-X / DROID / BridgeData 補 clipping 或 research note?
  • AgiBot-World 的資料收集方法(S14 討論過)是否值得整理成獨立 vault note?
  • Vault 是否需要一份「robotic dataset 對比表」(規模、模態、任務類型、授權)?

Connections