Context
Discord 討論中對「3D/4D 生成方法 × 機器人操作 × 安全評估」這個研究方向做了系統性的美國專利搜尋,目的是確認現有技術佈局與空白地帶,為專利申請策略提供依據。
已有對應美國專利的方向
機器人安全(HRI 碰撞)
- US12420422 — Situation-aware Safety Assessment of Robot-Human Activities:視覺感測 → 碰撞機率 × 嚴重程度 → risk score → 動作控制,是目前「視覺評估人機碰撞安全」最直接的授證案
- US11872702B2 — Robot Interaction with Human Co-workers(Dexai,2024):3D 模型幾何重疊 + 神經網路預測碰撞
AI 生成安全約束
- US20250042032A1(2025 申請中):LLM prompt + 環境文字描述 → 安全約束 → 修改控制信號;輸入端是文字,不是視覺圖像
- US20240253224A1 / US20240359319A1(Sanctuary AI,2024):LLM 驅動機器人系統,IPC 標記安全裝置分類
仿真驅動控制
- US11938638B2 — Simulation Driven Robotic Control(Google/GDM,2024):3D 點雲模擬環境 → 候選動作評估 → 執行真實機器人;目前最接近「pre-execution rollout」概念的授證案
Transformer + 視覺語言 → 動作
- US20240189994A1 — Real-world Robot Control Using Transformer NNs(Google,2024):對應 RT 系列,NPL 引用 Attention is all you need、EfficientNet
- US20240078429A1 — Control Policies for Robotic Agents(Google,2024):learned predictive model + MPC
Diffusion Policy
- US20250312914A1 — Transformer Diffusion for Robotic Task Learning(2025)
- US20250353169A1 — Semi-supervised Learning of Robot Control Policies(2025):NPL 只引用 RT-1 / RT-2,沒有引用 Diffusion Policy 原始論文
3D 重建基礎技術
- US12145617B2 — 3D Surface Reconstruction with Point Cloud Densification Using AI(NVIDIA)
確認的空白地帶
- 3DGS / NeRF 直接接機器人操作規劃 — 完全空白
- Video generation 做 pre-execution 模擬 — 完全空白(V-Dreamer、Cosmos Policy、GPC 均只有學術論文)
- Point cloud generation 做操作規劃 — 幾乎空白(US11938638B2 用的是靜態點雲,不是生成式)
- VLM 視覺評估機器人動作安全性(看圖評分)— 空白;US20250042032A1 最接近但輸入是文字
- 3D/4D 幾何世界模型 × 預執行安全評分 整合管線 — 空白
重要方法論發現
機器人 ML 領域的專利普遍不引用學術論文,claims 以廣泛技術概念描述為主,沒有標準 NPL 引用格式。這與生醫/化學領域差異很大。因此「從學術論文引用反查專利」的方法在這個領域效果有限,需改用 IPC 分類號 + 大公司 assignee 過濾。
IPC 分類號參考
| 技術方向 | 主要 IPC |
|---|---|
| Video / 影像生成 | G06T 13/xx |
| 3D 模型 / 點雲 | G06T 17/xx |
| 深度學習生成模型 | G06N 3/045 |
| 機器人程式控制 | B25J 9/16 |
| 機器人模擬 | B25J 9/1697 |
| 機器人安全裝置 | B25J 19/06 |
| ML 模擬 | G06F 30/27 |
搜尋策略:IPC:B25J9/1697 AND IPC:G06N3/045 可找深度學習 + 機器人模擬的申請