當前位置: 首頁 » 行業資訊 » 機器人»強化學習新方法，讓后空翻回旋踢再也難不倒機器人 | 伯克利論文

強化學習新方法，讓后空翻回旋踢再也難不倒機器人 | 伯克利論文

[點擊復制]

發布日期：2018-05-04 瀏覽次數：519

核心提示：波士頓動力人形機械人的后空翻技巧表態時，冷艷了全球大眾。這么龐雜的舉措，不消說實際世界中的機械人，就算是在模仿器里，學起來也異常的難。如今，加州年夜學伯克利分校和英屬哥倫比亞年夜學最新研討的一種新辦法

波士頓動力人形機械人的后空翻技巧表態時，冷艷了全球大眾。

這么龐雜的舉措，不消說實際世界中的機械人，就算是在模仿器里，學起來也異常的難。

如今，加州年夜學伯克利分校和英屬哥倫比亞年夜學最新研討的一種新辦法，能教生涯在模仿器中的機械人經由過程模擬人類，學會武打、跑酷、雜技等龐雜技巧。

后空翻盤旋踢甚么的，悄悄松松弄定~

（下文還會提到許多次“機械人”，根本都是生涯在模仿器里的這類）

讓機械人、動畫和游戲腳色能靈巧流利地活動，是盤算機圖形學、強化進修、機械人等等范疇的研討者都在尋求的目的。

分歧辦法各有所長，固然也各有所短。

用強化進修辦法教機械人（模仿器里的智能體），能學會的舉措名堂單一，過細到拿器械、豪邁到奔馳都能弄定，還可以給機械人設置一個明白的目標。然則，總不免演出一些羞辱或欣喜play。

而舉措捕獲技巧，能讓機械人做出和真人如出一轍，天然流利毫無背和感的舉措。然則，活學活用是不克不及期望的，每一個舉措、每一個形狀的機械人，都是須要零丁練習的。

伯克利的迷信家們取這兩個范疇所長，發明了一種新辦法DeepMimic。這類辦法既有深度進修模子的通用性，可以籠罩更多的舉措類型和機械人形狀，舉措的天然流利水平也能夠媲美舉措捕獲。

用這類新辦法，機械人畢竟是怎樣進修新舉措的呢？

簡略來講是經由過程看舉措片斷來進修，人類的舉措捕獲數據就是個很好的進修材料。給機械人展現一個舉措樣本，好比說下圖這個側空翻，右邊就是供機械人進修的示范樣本。

介入這項研討的迷信家們將示范舉措分化成一個q^0,q^1,…,q^T的序列，q^T表現的是在機械人在t時光步的目的舉措。而這個機械人進修的目的，就是要盡量祛除t時光步的現實舉措qT和目的舉措q^T的差距。

機械人勤奮地一直演習演習演習，直到本身的舉措不再羞辱，靈巧性和仿真度可以或許媲美演示視頻，像上圖左邊那樣。

指點這個演習進程的，是如許一個嘉獎函數：

除空翻，用這類辦法教出來的機械人還能學到中西跳舞、南拳北腿、跑步打把式乃至鯉魚打挺：

對著完善的舉措捕獲樣本，再copy一遍，有甚么意思？這項研討固然不止于模擬。DeepMimic能讓機械人經由過程模擬學會舉措以后，再活學活用起來。

好比當一個機械人學會了投球，便可以去履行一個演示樣本中沒有的義務。我們可以在模仿器中，指定一個目的讓它來投：

練習的機械人，也能夠長得和演示樣本不太一樣。好比說照樣用前邊的后空翻樣本，可以練習一個模仿波士頓動力Altas的機械人：

乃至不是人形的機械人，也能夠用人形樣原來練習。好比說這頭霸王龍，就是跟人形樣本進修的走路。在論文的主頁上，他們還展現了更多的例子，乃至還有獅子和龍~

下一篇：蔡鶴皋院士：一部高水平的機器人學科普佳作——評長篇小說《探秘機器人王國》

上一篇：德國研究智能蜘蛛機器人，未來真的會取代士兵嗎？真相讓你吃驚

[ 行業資訊搜索 ] [ 加入收藏 ] [ 告訴好友 ] [ 打印本文 ] [ 關閉窗口 ]

同類行業資訊

• 廣東推出12項硬核舉措力促AI與機器人產業躍升 • “人機協同”要發揮各自“比較優勢”——張進代
• 多地競逐具身智能人形機器人產業“加速跑” • 積極擁抱未來產業上交所舉辦人形機器人產業座
• 攀爬階梯、雪地奔跑，我國人形機器人實現重要技 • 中國人形機器人需求迎來爆發期
• 我國智能機器人產業企業超45萬家 • 家用市場期待機器人來“敲門”
• 人形機器人市場2025年迎量產元年全球年產量將 • 這個春節機器人元素滿滿青島多部門聯手布局新

共0條 [查看全部] 相關評論

展會更多+

第26屆上海國際清

2025數控機床與金

2025中國(上海)機

2025武漢國際工業

01-13第26屆上海國際清潔技術與設備博覽會

12-112025數控機床與金屬加工展暨第25屆中國國際工業博覽會

12-092025中國(上海)機器視覺展

12-042025第七屆亞洲消費電子技術展

12-032025世界機器人大會將于8月在北京召開

視頻更多+

中舟智能固守科技

玉灃科技：精研滑

新松機器人自動化

羅克韋爾自動化（

10-11中舟智能固守科技創新新品首發添彩中國夢

10-11玉灃科技：精研滑臺十二載遙遙領先的模組

08-05新松機器人自動化股份有限公司

07-18羅克韋爾自動化（中國）企業宣傳片

07-18凌華科技機器手臂視覺導引解決方案

點擊排行

積極擁抱未來產業上交所舉辦人

攀爬階梯、雪地奔跑，我國人形機

“人機協同”要發揮各自“比較優

廣東推出12項硬核舉措力促AI與

多地競逐具身智能人形機器人產

天堂色网-天堂色综合-天堂社区在线观看-天堂社区在线视频-天天操网-天天操网站

我的供應

我的求購

商鋪管理

工業機器人及行業應用

智能機器人

工業自動化

智能裝備

強化學習新方法，讓后空翻回旋踢再也難不倒機器人 | 伯克利論文

• 廣東推出12項硬核舉措力促AI與機器人產業躍升	• “人機協同”要發揮各自“比較優勢”——張進代
• 多地競逐具身智能人形機器人產業“加速跑”	• 積極擁抱未來產業上交所舉辦人形機器人產業座
• 攀爬階梯、雪地奔跑，我國人形機器人實現重要技	• 中國人形機器人需求迎來爆發期
• 我國智能機器人產業企業超45萬家	• 家用市場期待機器人來“敲門”
• 人形機器人市場2025年迎量產元年全球年產量將	• 這個春節機器人元素滿滿青島多部門聯手布局新

第26屆上海國際清	2025數控機床與金
2025中國(上海)機	2025武漢國際工業

中舟智能固守科技	玉灃科技：精研滑
新松機器人自動化	羅克韋爾自動化（