2025-12-12
【學術亮點-頂級會議論文】用於自動導航系統之具有異質時空互動圖的反向注意力加權深度強化學習方法
字體大小
小
中
大
【學術亮點-頂級會議論文】用於自動導航系統之具有異質時空互動圖的反向注意力加權深度強化學習方法
AI core Technology: Advanced Research and Resource Integration Platform or AI Technology【Department of Electrical Engineering / Hsiao-Ping Tsai / Associate Professor】
核心技術:AI核心技術之進階研究與資源整合平台【電機工程學系蔡曉萍副教授】
上架日期:2025/11/27
AI core Technology: Advanced Research and Resource Integration Platform or AI Technology【Department of Electrical Engineering / Hsiao-Ping Tsai / Associate Professor】
核心技術:AI核心技術之進階研究與資源整合平台【電機工程學系蔡曉萍副教授】
| 論文篇名 | 英文:Inverse Attention-Weighted Model with Heterogeneous Spatio-Temporal Interaction Graph for Autonomous Navigation Systems 中文:用於自動導航系統之具有異質時空互動圖的反向注意力加權深度強化學習方法 |
| 期刊名稱 | 2025 IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS 2025) (指標清單會議) |
| 發表年份, 卷數, 起迄頁數 | In Proceedings of the 2025 IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS), 19-25 October 2025, Hangzhou, China, pp. 2711-2717. |
| 作者 | Yi-Lin Li, Hsiao-Ping Tsai(蔡曉萍) |
| DOI | 10.1109/IROS60139.2025.11246086 |
| 中文摘要 | 我們提出了一種基於Res-MLP的注意力機制,用於同時存在動態與靜態障礙物的機器人導航場景,以提升避障能力與導航效果。傳統方法往往缺乏前瞻性的預測能力,且難以應對真實世界的複雜性,因而限制了其應用範圍。為解決這些問題,我們設計了一個基於Res-MLP的「反向注意力加權模組」,用於強化機器人與行人、機器人與障礙物之間的注意力品質,使模型在面對潛在風險時更具魯棒性與敏感度。我們的方法以HH attn為基礎,並融合了Gumbel Social Transformer(GST),使機器人導航能更準確與更安全。此外,我們構建了一個異質時空互動圖,並加入多種不同形狀的障礙物,以模擬更貼近真實的情境。透過課程式學習(curriculum learning),我們進一步提升了模型的效率與泛化能力。 實驗結果顯示,在高密度人群環境下,我們的方法達到96%的成功率;在含有多樣化障礙物的複雜場景中亦達到92%的成功率,展現出更強的特徵提取能力與更安全的導航表現。我們的方法在保守與積極之間取得良好平衡,使其成為一個具有實際部署潛力的可靠方案。 |
| 英文摘要 | We propose a Res-MLP-based attention mechanism for robotic navigation where dynamic and static obstacles coexist, enhancing collision avoidance and robot navigation. Traditional approaches struggle with predictive foresight and real-world complexity, limiting their applicability. To address these challenges, we introduce an inverse attention-weighted module based on Res-MLP module to refine Robot-Human and Robot-Obstacle attention, improving model robustness and sensitivity to hazards. Our approach builds upon HH attn and integrates the Gumbel Social Transformer (GST), enabling more accurate and safer robot navigation. Additionally, we construct a heterogeneous spatio-temporal interaction graph and incorporate diverse obstacle shapes to create realistic scenarios. Using curriculum learning, we improve model efficiency and generalization. Experimental results show a 96% success rate in high-density crowds and 92% in complex environments with diverse obstacles, demonstrating enhanced feature extraction and safer navigation. Our method achieves a balance between conservatism and assertiveness, making it a reliable solution for real-world deployment. |
| 發表成果與AI計畫研究主題相關性 | 機器人的移動能力是相關應用成功的關鍵技術之一,本論文研究提出的自主導航與避障技術,與智慧農場場域高度相關。在智慧農場中,農業機器人需在複雜、多變的環境中運作,例如穿梭於作物行間、避開農民與其他移動設備,以及處理不同形狀與動態的障礙物。論文中的 反向注意力加權模型、異質時空互動圖 以及 GST 的人機互動預測能力,能讓機器人更準確地辨識環境風險、提升對人員與障礙物的感知能力,進而強化其在農場中的行走安全與運作效率。更進一步,本模型的架構不僅限用於行人軌跡預測,亦可應用其他動態物件的探索。此外,透過論文採用的 課程式學習與強化特徵提取技術,智慧農場機器人可以在多變的農業情境下具備更好的適應性與泛化能力,減少因環境複雜、植物生長差異或農民動線不固定而產生的導航困難。因此,該研究成果可為智慧農場的自主作業,如巡田、採摘、運送與環境監測等功能,提供關鍵的 AI 技術基礎。 |