美國加州大學(xué)伯克利分校、西蒙弗雷澤大學(xué)和喬治亞理工學(xué)院的聯(lián)合機器人團隊最近創(chuàng)建了一種強化學(xué)習(xí)模型,能讓四足機器人以守門員的身份高效踢足球。在arXiv上預(yù)先發(fā)表的一篇論文中介紹的該模型,通過反復(fù)試驗不斷提高了機器人的技能。
研究人員稱,通過讓四足機器人踢足球,可突破四足機器人的人工智能極限。守門員是一項有趣但具有挑戰(zhàn)性的任務(wù),它需要機器人對快速移動的球作出反應(yīng),有時需在空中飛行,并在很短的時間內(nèi)(通常在一秒鐘內(nèi))動態(tài)攔截它。
新研究的主要目標是創(chuàng)造一個四足機器人守門員,它可像人類守門員一樣在比賽中完善其技能。為此,研究人員開發(fā)了一種強化學(xué)習(xí)模型,讓該模型通過試錯而不是固定的人工設(shè)計策略來訓(xùn)練機器人。
研究人員解釋說,機器人首先學(xué)習(xí)不同的運動控制策略來執(zhí)行不同的技能,例如躲避、前撲和跳躍,同時記錄機器人腳趾的隨機軌跡。基于這些控制策略,機器人接著學(xué)習(xí)高級規(guī)劃策略,在檢測到球的位置和自身狀態(tài)后,選擇最佳技能和動作來攔截球。
經(jīng)過一系列模擬足球比賽,團隊訓(xùn)練了強化學(xué)習(xí)模型。隨后他們將它學(xué)到的策略部署在麻省理工學(xué)院開發(fā)的四足機器人MiniCheetah上,并在現(xiàn)實世界中測試了它的性能。
研究表明,強化學(xué)習(xí)框架可極大地提高MiniCheetah作為足球守門員的能力。在真實世界測試的40次隨機射門中,機器人撲救成功率達87.5%。
研究人員稱,此項工作最酷炫的是,四足機器人MiniCheetah能執(zhí)行跳躍和前撲等非常敏捷的運動技能,以及快速和精確的操作技能,例如在一瞬間擺動機器腿把球推開。這實際上突破了機器人領(lǐng)域“腿運動”的界限,表明腿也可以是一個機械手。
由于該模型可提高四足機器人的敏捷性和身體能力,因此這些機器人還可用于處理完全不同的任務(wù),例如搜索和救援任務(wù)。也許不久的將來,四足機器人也可與人類足球運動員同場競技。
關(guān)鍵詞: 美國加州大學(xué) 伯克利分校 西蒙弗雷澤大學(xué) 喬治亞理工學(xué)院