Context

Discord 討論中對「3D/4D 生成方法 × 機器人操作 × 安全評估」這個研究方向做了系統性的美國專利搜尋,目的是確認現有技術佈局與空白地帶,為專利申請策略提供依據。

已有對應美國專利的方向

機器人安全(HRI 碰撞)

  • US12420422 — Situation-aware Safety Assessment of Robot-Human Activities:視覺感測 → 碰撞機率 × 嚴重程度 → risk score → 動作控制,是目前「視覺評估人機碰撞安全」最直接的授證案
  • US11872702B2 — Robot Interaction with Human Co-workers(Dexai,2024):3D 模型幾何重疊 + 神經網路預測碰撞

AI 生成安全約束

  • US20250042032A1(2025 申請中):LLM prompt + 環境文字描述 → 安全約束 → 修改控制信號;輸入端是文字,不是視覺圖像
  • US20240253224A1 / US20240359319A1(Sanctuary AI,2024):LLM 驅動機器人系統,IPC 標記安全裝置分類

仿真驅動控制

  • US11938638B2 — Simulation Driven Robotic Control(Google/GDM,2024):3D 點雲模擬環境 → 候選動作評估 → 執行真實機器人;目前最接近「pre-execution rollout」概念的授證案

Transformer + 視覺語言 → 動作

  • US20240189994A1 — Real-world Robot Control Using Transformer NNs(Google,2024):對應 RT 系列,NPL 引用 Attention is all you need、EfficientNet
  • US20240078429A1 — Control Policies for Robotic Agents(Google,2024):learned predictive model + MPC

Diffusion Policy

  • US20250312914A1 — Transformer Diffusion for Robotic Task Learning(2025)
  • US20250353169A1 — Semi-supervised Learning of Robot Control Policies(2025):NPL 只引用 RT-1 / RT-2,沒有引用 Diffusion Policy 原始論文

3D 重建基礎技術

  • US12145617B2 — 3D Surface Reconstruction with Point Cloud Densification Using AI(NVIDIA)

確認的空白地帶

  1. 3DGS / NeRF 直接接機器人操作規劃 — 完全空白
  2. Video generation 做 pre-execution 模擬 — 完全空白(V-Dreamer、Cosmos Policy、GPC 均只有學術論文)
  3. Point cloud generation 做操作規劃 — 幾乎空白(US11938638B2 用的是靜態點雲,不是生成式)
  4. VLM 視覺評估機器人動作安全性(看圖評分)— 空白;US20250042032A1 最接近但輸入是文字
  5. 3D/4D 幾何世界模型 × 預執行安全評分 整合管線 — 空白

重要方法論發現

機器人 ML 領域的專利普遍不引用學術論文,claims 以廣泛技術概念描述為主,沒有標準 NPL 引用格式。這與生醫/化學領域差異很大。因此「從學術論文引用反查專利」的方法在這個領域效果有限,需改用 IPC 分類號 + 大公司 assignee 過濾。

IPC 分類號參考

技術方向主要 IPC
Video / 影像生成G06T 13/xx
3D 模型 / 點雲G06T 17/xx
深度學習生成模型G06N 3/045
機器人程式控制B25J 9/16
機器人模擬B25J 9/1697
機器人安全裝置B25J 19/06
ML 模擬G06F 30/27

搜尋策略:IPC:B25J9/1697 AND IPC:G06N3/045 可找深度學習 + 機器人模擬的申請

Connections