天堂色网-天堂色综合-天堂社区在线观看-天堂社区在线视频-天天操网-天天操网站

 
當前位置: 首頁 » 行業資訊 » 智能制造»從概念上看看智能機器人的新范式:深度強化學習;
   

從概念上看看智能機器人的新范式:深度強化學習;

 46.1K
     [點擊復制]
放大字體  縮小字體 發布日期:2016-08-30   瀏覽次數:380
核心提示:近兩年機器智能取得重大突破,像圍棋九段高手李世石敗北Alpha Go,DeepMind團隊研發的機器人在Atari多項游戲上超越人類水平。這
       近兩年機器智能取得重大突破,像圍棋九段高手李世石敗北Alpha Go,DeepMind團隊研發的機器人在Atari多項游戲上超越人類水平。這些突破主要得益于從基于深度學習的視覺、語音、語義感知到動作反饋的激勵懲罰強化訓練模式。本文從概念上分析深度強化學習的要點,部分摘于ICML 2016 Tutorial里的Deep Reinforcement Learning[1]的報告。

  強化學習,即機器人根據環境里動作得到的懲罰和激勵去自動調整策略。通過訓練,機器人學到一組策略:在環境狀態S下應采取動作A,(可)能獲得最大累積獎勵V。

  強化學習有豐富的交叉學科背景,包括經濟學、工程學、神經科學里的博弈論、優化控制,條件反射系統。


       深度學習,使用深度神經網絡實現機器人的記憶,視覺感知,語音語義理解和生成。

  深度強化學習以深度學習做感知,強化學習訓練策略,并且以深度神經網絡作為策略載體。相比于傳統的多模塊組合,深度強化學習實現了從感知到控制的端到端直接訓練,減少了模塊間信息損失。

  最近兩年在學術理論上,GoogleDeepMind團隊在連續性動作控制[2],異步訓練[3],訓練框架[4],分布式訓練[5]等都有重要突破,為智能機器人的研發奠定理論和實踐基礎。

  在特定任務的應用上,深度增強學習已有廣泛實踐嘗試,例如流水線機器人。

  在集成應用上,深度強化學習在自動駕駛,聊天機器人[6][7]都有良好的前景。例如,使用分布式訓練或異步訓練,自動駕駛汽車可以多輛同時在各種環境學習,并且相互交換知識,加速學習過程。聊天機器人可以通過對話過程中用戶的反饋來調整自己的語言表達,逐步成長。

  深度強化學習為智能機器人提供了新的計算范式:提供環境、激勵和懲罰、神經網絡結構即可訓練得到最大化獎勵的智能機器人。


 
 
 
[ 行業資訊搜索 ]  [ 加入收藏 ]  [ 告訴好友 ]  [ 打印本文 ]  [ 關閉窗口 ]
 
 
展會更多+
視頻更多+
點擊排行
 
網站首頁 | 網站地圖 | 排名推廣 | 廣告服務 | 積分換禮 | 網站留言 | RSS訂閱
主站蜘蛛池模板: 日本一道在线观看 | 日本高清视频wwww色 | 日韩色影院 | 中文字幕亚洲欧美 | 521香蕉视频 | 欧美成人免费公开播放 | 视频一区中文字幕 | 亚洲国产精品综合欧美 | 在线高清一级欧美精品 | 国产久爱青草视频在线观看 | 成人手机在线视频 | 午夜毛片视频高清不卡免费 | 国产一区二区三区在线观看免费 | 日本三级免费看 | 曰批全过程免费视频播放网站 | 欧美日韩国产在线播放 | 曰本还a大片免费无播放器 曰本三级香港三级三级人 孕交videos小孕妇xx中文 | 天天躁日日躁狠狠躁欧美日韩 | 天天做天天添婷婷我也去 | 99资源在线观看 | 免费观看欧美一级高清 | 最近免费2019中文字幕大全 | 777毛片| 日韩伦理一区二区三区 | 在线欧美a | 色婷婷狠狠久久综合五月 | 欧美日在线 | 精品综合久久久久久99 | 免费国产小视频 | 成年香蕉大黄美女美女 | 免费亚洲视频在线观看 | 欧美日本一区二区三区道 | 日韩中文字幕一区二区不卡 | 在线看mv的网站入口免费 | 亚洲欧美日韩在线观看播放 | 色六月婷婷 | 国产精品入口麻豆免费看 | 在线国产片 | 国产欧美日韩一区 | 中国一级黄色录像片 | 欧美成年视频 |