How Do We Research HRI in the Age of LLMs?

本文由 AI 分析生成

建立時間： 2026-04-01 來源： https://arxiv.org/abs/2602.15063

Summary

A PRISMA-compliant systematic review of 86 papers (2021–2025) on how LLMs are transforming Human-Robot Interaction. The central contribution is the Sense-Interaction-Alignment (SIA) framework — a replacement for the classical Sense-Plan-Act model — and a nine-dimension taxonomy covering perception, interaction, alignment, modality, morphology, autonomy, methodology, evaluation, and application domain. The paper documents explosive growth (311 publications in 2024 alone) but diagnoses the field as fragmented and largely exploratory, lacking standardized evaluation and longitudinal studies.

LLM 如何改變人機互動的 PRISMA 系統性回顧，分析 86 篇論文（2021–2025）。核心貢獻是「感知—互動—對齊（SIA）框架」，取代古典 Sense-Plan-Act 模型，並建立九維分類體系。論文記錄 LLM-HRI 研究的爆炸性成長（2024 年 311 篇），但診斷該領域仍高度分散，缺乏標準化評估與縱向研究。

Key Points

SIA 框架：Sense（LLM 在物理/社會脈絡中的接地）→ Interaction（生成式、代理式協作）→ Alignment（持續個人化與修復機制），取代被動的 Sense-Plan-Act 典範
九維分類：感知理解、生成互動、迭代對齊、互動通道、機器人型態、自主程度、方法論、評估指標、應用領域（IRR κ = 0.684–0.904）
成長數據：2019 年 1 篇 → 2023 年 108 篇 → 2024 年 311 篇；86 篇入選文章集中於 2024–2025
主要場景：社交對話（最多）、醫療健康、家庭日常、教育、工業製造、AR/VR 互動、公共空間服務
評估碎片化：客觀指標（任務效率、LLM 效能）與主觀指標（感知智慧、擬人化、認知負荷）並存，但無統一標準
八大設計挑戰：嘈雜環境可靠性、多模態情感感知、信任校準、長期參與、計算開銷、演算法偏差、倫理對齊、無損多模態接地
人本考量被忽視：現有研究往往忽略 HRI 的人本核心——使用者建模、自主程度光譜、人類監督機制等研究嚴重不足

Insights

SIA 框架中「Alignment 階段」的設計最值得關注。現有 HRI 研究幾乎都聚焦在 Sense（感知）和 Interaction（對話生成），但 Alignment（隨時間持續調整）才是長期部署的核心挑戰。論文把修復機制分為三層——行為修復（任務失敗）、情感修復（社交摩擦）、倫理修復（規範違反）——這個分層對設計實際系統很有用，因為三層所需的干預手段截然不同。

「計算開銷」被列為八大挑戰之一，反映一個實際矛盾：最強的 LLM 推理能力（GPT-4V 等）與機器人的邊緣計算資源之間存在巨大鴻溝。這使得 VLM 的「直接場景解讀」路線（bypass 中間文字抽象）雖然更準確，但目前仍難以在實機上低延遲運行。

論文特意區分「embodied robot」與「disembodied chatbot」的 HRI 定義，且要求研究必須有實際用戶研究（empirical user studies）才算入。這個篩選標準讓 86 篇數字比直覺上少，也說明目前真正落地測試的 LLM-HRI 系統仍是少數。

Connections

human-robot-interaction — VAM-HRI 背景文件，與本篇 HRI 演化論述互補
vam-hri-2025-workshop — VAM-HRI 2025 論文中 #2（LLM+共享控制）和 #7（LLM+安全標注）正是本篇分類的「Generative Interaction」和「Contextual Perception」的實例
vam-hri-2024-workshop — VAM-HRI 2024 #6（Wizard-of-Oz 比較）和 #10（VR 使用者研究方法論）呼應本篇對「方法論碎片化」的批判
Clippings-130-robotics-world-model-reading-club-01 — 世界模型視角下的 VLA/WAM 轉移，與本篇 LLM+HRI 的 Sense 階段形成技術層的對應

bot_vault

Explorer

How Do We Research HRI in the Age of LLMs? — Systematic Review

Summary

Key Points

Insights

Connections

Graph View

Table of Contents

Backlinks