Summary

OSMO is an open-source wearable tactile glove with 12 three-axis magnetic tactile sensors across fingertips and palm, designed for human-to-robot skill transfer. The key insight is that vision-only demonstrations cannot capture force information critical for contact-rich tasks; by equipping both the human demonstrator and the robot with the same glove, OSMO minimizes the visual-tactile embodiment gap. A robot policy trained exclusively on human OSMO demonstrations (no robot data) achieves 72% success on a real-world wiping task requiring sustained contact pressure, outperforming vision-only baselines.

OSMO 是開源穿戴式觸覺手套,裝備 12 個三軸磁性觸覺感測器,用於人類到機器人的技能轉移。核心洞察是:視覺示範無法捕捉接觸力,而讓人與機器人共穿同一款手套可最小化具身差距。僅使用人類示範訓練的觸覺感知策略在真實擦拭任務中達成 72% 成功率,明顯優於純視覺基線。

Prerequisites

  • Magnetic tactile sensing — OSMO 的 sensing 原理基於磁力計量測軟磁性彈性體形變,理解此機制有助於評估其精度與局限
  • Kinematic retargeting — 將人類手部動作映射至機器人手部的方法,是本文 pipeline 的核心組件
  • Imitation learning / LfD — 本文的機器人政策直接從人類示範中訓練,不使用機器人資料,是 learning from demonstration 的實例

Core Idea

視覺資料無法捕捉接觸力——相同的視覺外觀可對應截然不同的力控制策略。OSMO 透過在人和機器人之間共享同一款觸覺手套,將連續的法向力(normal force)與剪切力(shear force)從人類示範直接傳遞至機器人政策,而無需視覺推斷或圖像修復(inpainting)。磁性感測器的 MEMS 架構允許薄形可穿戴設計,12 個感測點覆蓋指尖與手掌,感測範圍 0.3 N–80 N。感測器密度帶來的串擾(crosstalk)透過 MuMetal 磁屏蔽解決。

Results

Task / MetricOSMO Tactile PolicyVision-Only Baseline
Wiping task success rate72%Significantly lower (contact failures)
Data sourceHuman demos only (no robot data)Human video demos
Force axes captured3-axis (normal + shear)None

Limitations

  • Author-stated: 僅在擦拭任務評估;policy transfer 依賴運動學相似性(使用 Psyonic Ability Hand,需要人形機器人手)
  • Unstated: 感測器校準和耐久性未長期測試;批量生產成本與商業化可行性未討論;12 個感測點覆蓋有限,中間指節缺乏感測

Reproducibility

  • Code: 完整開源——硬體設計、韌體、組裝說明均公開
  • Datasets: 自建真實世界示範資料集(擦拭任務)
  • Compute: 邊緣部署(STM32 微控制器),訓練需 GPU

Insights

  1. 同一手套穿戴策略的創新性:讓人和機器人共穿同款手套大幅減少轉移問題,是簡單而有效的具身差距解決方案
  2. 觸覺作為 LfD 的缺失模態:視覺、語言作為 LfD 信號已廣泛研究;觸覺作為第三模態仍是藍海,OSMO 的開源策略有助於推動資料收集
  3. 與 STAG(MIT/Nature 2019)的對比:同樣是觸覺手套,STAG 聚焦於理解人類抓取;OSMO 聚焦於向機器人轉移,代表觸覺感測從科學理解到工程應用的演進

Connections

Raw Excerpt

“By equipping both the human and the robot with the same glove, OSMO minimizes the visual and tactile embodiment gap, enabling the transfer of continuous shear and normal force feedback while avoiding the need for image inpainting or other vision-based force inference.”