【
儀表網 研發快訊】近日,華中科技大學電信學院與北京通用人工智能研究院(簡稱“北通院”)攜手,在人工智能領域頂級國際期刊IEEE Transactions on Pattern Analysis and Machine Intelligence在線發表了題為“M2Diffuser:Diffusion-based Trajectory Optimization for Mobile Manipulation in 3D Scenes”的最新研究成果。該成果為機器人在復雜三維場景下實現高效、精準的移動操作提供了全新的解決方案。論文第一作者為電信學院“通計劃”2024級聯合培養博士生鄢思旭,電信學院王興剛教授與北通院劉航欣研究員為論文共同通訊作者。
當前,人工智能與機器人技術的融合正不斷帶來新成果。然而在移動操作這一關鍵領域,傳統方法長期以來面臨著諸多挑戰,例如高維動作空間、復雜環境交互以及嚴格的物理約束等。M2Diffuser全稱為“Mobile Manipulation Diffuser”,是一種基于擴散模型的場景條件生成模型。它首次結合了學習方法與傳統規劃方法的優勢,直接從機器人中心的3D掃描數據中生成高效、協調的全身運動軌跡。這一創新方法不僅能夠靈活地適應各種復雜的任務目標,還能在每次去噪步驟中以完全可微分的方式減少物理違規和執行錯誤,確保機器人的動作既安全又精準。
三維場景下的移動操作挑戰
在過去,無論是基于學習的自回歸規劃方法,都依賴于完美環境知識的傳統規劃方法,難以在復雜的真實世界環境中實現高效、可靠的移動操作。學習方法雖然能夠從數據中學習到復雜的技能,但在模型推理過程中往往難以完全消除物理約束的違反;而傳統規劃方法則因對環境建模的嚴格要求和對目標的過度依賴,難以在實際應用中實現廣泛的擴展。
為了突破這些瓶頸,研究團隊首先開發了M3Bench——一個涵蓋30000個物體操作任務的移動操作基準測試平臺,覆蓋119種多樣化的家庭場景。該平臺不僅提供了豐富的專家演示數據,還配備了元數據采集接口,構建了從基礎抓取到復雜場景操作的任務譜系。M3Bench的開發為M2Diffuser 提供了高質量的訓練數據,確保了模型在復雜三維環境下的高效學習和優化能力。這一平臺的出現,不僅解決了移動操作研究中缺乏
標準化測試平臺的問題,還為全身運動規劃研究提供了系統化的評估框架,支持對運動生成算法進行全面驗證。
M3Bench移動操作測試平臺
M2Diffuser利用擴散模型的強大能力,可以直接學習運動軌跡的概率分布。在推理過程中,M2Diffuser將物理約束和任務目標建模為可微分的成本和能量函數,引導優化過程,確保生成的軌跡既符合物理規律,又能精準完成任務目標。這一過程中,M2Diffuser不僅能夠處理復雜的全身運動軌跡,還能在多種任務之間靈活切換,展現出極高的適應性和泛化能力。
M2Diffuser模型架構
實驗結果表明,M2Diffuser相較于基線方法在所有性能指標上實現了質的提升(平均提升26%)。它不僅在熟悉和未知場景中均展現出更高的成功率,還通過優化機制大幅降低了碰撞率,并生成了更平滑、更符合關節限制的運動軌跡。此外,M2Diffuser憑借其迭代去噪過程和全局優化能力,能夠生成更接近全局最優解的運動軌跡,有效避免了短視規劃問題。它還首次實現了從仿真到真實世界的無縫遷移,直接將基于模仿學習的神經運動規劃器應用于真實家庭環境中的移動操作任務,并成功處理了未見過的環境和物體,充分證明了其在復雜真實場景中的泛化能力和魯棒性。
M2Diffuser仿真測試
M2Diffuser真機測試
M2Diffuser有望賦能機器人在復雜環境中自主、高效地完成各種任務,為智能工廠、家庭服務機器人、物流配送等領域帶來革命性變革,極大地提高生產效率和生活質量。該成果的取得也是我校與北京通用人工智能研究院圍繞“通計劃”開展合作研究取得的重要成果之一。
所有評論僅代表網友意見,與本站立場無關。