天堂色网-天堂色综合-天堂社区在线观看-天堂社区在线视频-天天操网-天天操网站

 
當前位置: 首頁 » 行業資訊 » 智能制造»第四范式首席科學家楊強教授:未來人工智能會讓二流科學家失業;
   

第四范式首席科學家楊強教授:未來人工智能會讓二流科學家失業;

 46.1K
     [點擊復制]
放大字體  縮小字體 發布日期:2016-09-13   瀏覽次數:394
核心提示:楊強,第四范式聯合創始人、首席科學家。楊強教授在人工智能研究領域深耕三十年,是國際公認的人工智能全球頂級學者,ACM杰出科
          楊強,第四范式聯合創始人、首席科學家。楊強教授在人工智能研究領域深耕三十年,是國際公認的人工智能全球頂級學者,ACM杰出科學家,兩屆「KDDCup」冠軍。現任香港科技大學計算機與工程系主任,是首位美國人工智能協會(AAAI)華人院士,AAAI執行委員會唯一的華人委員,國際頂級學術會議KDD、IJCAI等大會主席,IEEE大數據期刊等國際頂級學術期刊主編。楊強教授在數據挖掘、人工智能、終身機器學習和智能規劃等研究領域都有卓越的貢獻,是遷移學習領域的奠基人和開拓者,他發表論文400余篇,論文被引用超過兩萬次。

  近日,機器之心對楊強教授進行了專訪,他對遷移學習、人工智能行業與技術進行了深入講解,并對人工智能從業者提供了眾多有價值的建議。

  楊強教授

  關于遷移學習

  機器之心:您目前主要從事哪方面的研究工作?

  楊強:我現在做的一項研究是把深度學習、強化學習和遷移學習結合起來,讓深度學習有目標。基于有目標的延遲反饋的機器學習在現有的深度學習中做的不是太好,比如RNN能夠解決序列到序列的學習(Sequenceto Sequence Learning),但它比較短視,沒有最終目標和最終反饋。這就會出現很多問題,比如說推薦系統就沒有辦法在對話中有效地,自然地使用。同時,在自然語言對話中,只會出現毫無目的的閑聊,使得用戶體驗會不太好。要改變這些問題,就一定要引入強化學習,這樣才可以進行推理并具有長期的目標。同時在這些算法之上再加一個遷移學習的算法層。這樣,可以把一個通用的學習模型「個性化」到每個人不同的需求和興趣上。這是我們目前所聚焦的研究領域。

  機器之心:提到不同學習方法的結合,ACM8月份CACM(communication of the ACM)刊文《強化學習的復興(Reinforcement Renaissance)》,深度學習和強化學習結合的深度強化學習帶來了更好的表現,您之前也在演講中提過兩者的結合,能具體解釋一下嗎?

  楊強:強化學習原來特別地難以有效的擴展,這是因為它的狀態空間太大;另外,這些狀態,都是憑某個專家的經驗來人為地定義的,而并不是學習出來的。但是,現在通過和深度學習的結合,我們可以把強化學習的目標和反饋拿出來,把規劃的目標轉化成一個學習的目標,即lost function,而用來訓練一個「端到端的」深度學習系統。DeepMind在這方面就做的比較成功。這樣,深度學習就有目的性了,因為可以得到有效的反饋機制來幫助學習。

  但是,我們也要看到,這樣做了以后,缺點也隨之出現——比如說DeepMind那個模型,它是不可解釋的,因此很難把人的經驗放進去,也很難在這個強化學習模型上面做任何的「知識短路」,即個性化。我們看到,遷移學習是在狀態空間上的一種知識短路,這是我們的一個新發現:即遷移學習更容易在知識結構上從小數據中學習。這樣,在應用中,可以先訓練一個深度學習和強化學習的合并模型,然后用近似的方法把狀態顯現化,最后,再在這個近似空間的轉移中做一個遷移學習模型。這就是我們現在所做的研究。

  機器之心:能否介紹一下遷移學習這幾年發展的亮點以及現階段的研究難點,比如您之前提到過的「兩個領域衡量標準」問題。

  楊強:遷移學習在這幾年有挺大突破,比如它和深度學習的結合。遷移學習的一個發現就是用特征做遷移效果非常好,關鍵是怎么找到這些好的特征將兩個領域給結合起來,換句話說,就是要找到合適的遷移機制。我們可以通過什么把知識從一個領域遷移到另外一個領域呢?我們發現最好就是找到一些比較通用的特征,比如說在大陸這邊,汽車的駕駛員坐在左邊,而在香港駕駛員坐在右邊。那么,你怎么讓一個大陸的駕駛員一來到香港就馬上就適應,而回到大陸又可以迅速調整回來,做到左右逢源呢?那就需要找到一個知識的表達方式——即駕駛員和馬路的關系的表達——司機的位置如果是靠路中間,那不管在大陸還是在香港都肯定沒錯。而這種通用的表達方式就是深度學習可以幫你找到的。當你把兩個不同領域都作為輸入給深度學習系統,它會幫你找到一個共同的不變的表達,然后就可以通過這個不變量來做遷移。
  所以,遷移學習在最近的一個進展就是,通過深度學習發現不同隱含層有不同的遷移能力,比如說,在音頻上偏高層就比較容易遷移;視頻上偏低層比較容易遷移,但每一層能遷移的知識和量不一樣。這樣我們對遷移能力就能有了定量認識,又往前走了一步。這只是一個很好的研究方向。但是遷移學習目前比較難的一點,是衡量兩個領域之間的距離。過去的研究,學者們只是靠純統計的方法。而現在,有了深度學習以后,就可以把在不同層次的特征拿過來,發現不同層次的距離是不一樣的,而利用這些不同的「知識點」來理解遷移學習的能力。這一點是一個新的突破口。

  機器之心:最近有一項關于用遷移學習研究非洲貧困的案例,斯坦福研究者回避了其他收集成本過高的指標,而是使用衛星圖像獲取的燈光信息來判斷貧困程度,您如何看待里面的技術,以及此項研究本身涉及的意義呢?

  楊強:是的,這是個很有趣的案例。在這個案例里,燈光就變成了一個不變量。它能反映貧富,又能反映路段,只要預訓練燈光,就可以把這段知識遷移到那段去,這是一個很好的例子。但有特別需要說明的一點是,這是其中一種遷移學習的手段,叫傳遞式遷移,是說從a到b到c三個領域的傳遞,這個鏈條可以任意的長,從1到N。其實我們日常中都在用這種方式,比如學生第一學期上的課和最后一個學期上的課就可以看成一個遷移鏈條,上完這門課再上下一門,很多知識就可以被遷移和應用,新東西學起來就覺得容易,課程一個個過來就可以畢業了。我們人類已經在使用這種方式——把一個難的問題分解成一系列問題。

  機器之心:目前遷移學習的研究成果在哪些領域應用的比較好?

  楊強:遷移學習在好幾個領域都能發揮作用,比如說電商上面的推薦,你做了一個領域的推薦模型,當出現一個新的領域時,就可以遷移過去,這兩個領域有區別,但有些是共通的。

  第一個應用的例子是推薦系統里的一個非常棘手的問題,就是「冷啟動」。就是說,在沒有任何用戶數據的情況下,我們如何能夠讓系統推薦的結果還不錯?一個做法是,可以從一個類似的領域遷移過來。第二個是「個性化」:每個人都希望在手機上了解我們的智能助手,「懂我」的意思就是已經基于你的需求進行個性化了。使用遷移學習就可以利用你的數據從一個通用模型遷移到你的個人模型。第三應用領域是小數據,大家都知道大數據可以用深度學習做,但大數據的獲取只有少數大公司才能做到,而大部分公司是沒有這個資源的,他們只有小數據,有個辦法就是從大數據獲得的模型往小數據遷移。第四個是可以用在隱私方面,我們如果能把一個大數據的模型實現本地化。這樣,就沒有必要去把本地隱私的數據上傳到云端,而個人隱私就可以獲得保護,我覺得這是解決隱私問題最有效的一個方式,如果遷移學習能解決的話,那加密、利用隨機擾亂等技術來保護隱私的辦法都不用做了,因為這些方法對模型的效果影響很大。

  機器之心:關于隱私,您在2015年發了一篇關于差分隱私(Differential Privacy)的文章。隨著您剛才提到的「個性化人工智能」的推進,敏感數據的隱私問題日漸受到更多關注。您能基于當時那篇文章講解一下嗎?

  楊強:這是當時在華為諾亞方舟實驗室和上海聯通合作的一個項目。我們在電信數據的挖掘上,發現數據挖掘中一個很受追捧的概念就是「差分隱私」技術。這個概念在學術界很流行,但我們發現在工業上,它的應用卻很少。這個算法在實際問題中用不了的原因,是它沒有考慮一個重要因素:一方面要保護隱私,另一方面要保證模型的表現不下降。如果保護的多,那模型的效果就會下降的就特別多,而這種效果的下降是可以用錢來衡量的。而隱私如果也能換成錢,那么,就可以在這兩者間做一個權衡。但是,從來沒有人這么做過。所以我們當時寫了一篇論文來指出了這一點。也就是,過去大家一味的去關心隱私其實是一種偏頗,而隱私的問題應該把效果和價值來綜合來考慮。差分隱私在學術界是一種很優秀的做法,但可能不適合工業界,因為在工業界需要從效果總體上進行權衡。

  機器之心:遷移學習可以實現「舉一反三」(和人類智能類似),這好像與我們要實現的人工智能終極目標最為相似,那如果接下來人工智能要取得突破,遷移學習會成為其中最關鍵的路徑嗎?

  楊強:遷移學習只是路徑之一,應該說,更重要的是表達學習,即學習知識的表達。遷移是知識表達的一個試金石:如果表達找的好,那就遷移的好,深度學習是表達的一個路徑,但不是唯一路徑。如果要把知識表達進行分解的話,其中的遷移能力是特別重要的,比如能做比喻學習(learning by analogy)等。

  關于人工智能行業

  機器之心:您在大企業研究院(華為諾亞方舟、微信聯合實驗室)、高校(HKUST)和創業公司(第四范式)進行研究,這些機構在研發方法和目標上有何異同?

  楊強:在工業界應該是應用研究,更多著眼把一個技術實用化以產生價值,而這個技術最好今天就解決問題;大學是長遠的,更理論化的研究,目標比較高遠,大學的研究所應該做明天要做的事情。現在我看到一個現象是,公司有實驗室在做大學的事情,大學有實驗室做公司的事情,我預計這些很難成功。因為他們都在做別人應該做的事情。如果公司做純高校的事情一定長久不了,他們要產生價值,公司無法去養這么多學者。
   機器之心:您提到過人工智能的五個條件:清晰的商業目標、高品質的大數據資源、清晰的問題定義和領域邊界、了解人工智能跨界人才、強大的硬件計算能力。「第四范式」這個公司目前在做的金融行業對此非常符合,能否透露一下,公司下一個重點拓展的行業是什么?

  楊強:金融可能是我們的第一個點,但第四范式的重要目標是做一個平臺,這個平臺能夠讓大眾變成人工智能應用者,大家只要自己有數據和應用問題,想利用這個平臺,都可以來用。為什么先選擇金融領域,傳統金融領域需求比較大,門檻比較高,如果在這個領域成為一個領先者就很容易保持優勢,有了這個優勢之后可以鋪開做。

  機器之心:科技巨頭對人工智能創業公司的收購越來越頻繁,這是否會加劇您提到的「人工智能是富人的游戲」這種現象?對于第四范式來說,考慮過被巨頭收購的可能嗎?

  楊強:這肯定會加劇,相信一些創業公司聚集了一批優秀人才,但是也存在有些創業公司的目的就是被巨頭收購,最后逐漸就變成巨頭一統天下了,小的諸侯國被吞并,秦朝統一六國,這并不有利于百花齊放。

  那對于第四范式來說,我們匯聚了機器學習領域的優秀科學家、工程師和咨詢專家,從實戰中不斷優化研發與服務水平。目前第四范式在工業界發展非常好,我們也希望它在科學上不負眾望,能夠規避人工智能被個別的集團所壟斷的風險、從而引導人工智能走向大眾,為社會所用,這也是我作為一個科學家的使命。

  機器之心:現在看到有種趨勢,比如說從論文發表來看,公司在人工智能的某些前沿研究上已經超過了高校。

  楊強:因為公司現在有資本有數據,所以吸引了很多人,這些人是沖著資源去的,比如說數據和機器,這是現在的一個階段。但是比如說理論研究問題,目前我們對深度學習本身的理解還不夠深,如果要解決這個問題,就不應該在公司做。但是你要去實現大規模的深度學習系統,利用大數據去做一件前人沒有做的事情,那一定要在公司做,在大學做不了。

  但特別要指出的是,我經歷了很多公司,發現它們并不是像外界所想的那樣就一定有數據,很多數據其實是大學來找更加方便,因為大學是中立的、非盈利機構,大家更樂意把數據給出來。

 
 
 
[ 行業資訊搜索 ]  [ 加入收藏 ]  [ 告訴好友 ]  [ 打印本文 ]  [ 關閉窗口 ]
 
 
展會更多+
視頻更多+
點擊排行
 
網站首頁 | 網站地圖 | 排名推廣 | 廣告服務 | 積分換禮 | 網站留言 | RSS訂閱
主站蜘蛛池模板: 亚洲高清国产品国语在线观看 | 成年人免费在线播放 | 日韩综合在线 | 成人福利免费在线观看 | 欧美一级精品 | 午夜精品久视频在线观看 | 两性午夜欧美高清做性 | 亚洲成a人片在线观看 欧美 | 免费成人在线观看 | 成人午夜视频免费看欧美 | 日本欧美不卡一区二区三区在线 | 中文字幕在线观看第一页 | 成年黄网站在线观看免费 | 99精品热视频 | 国产精品一区二区三区久久 | 日本精品一区二区三区在线视频 | 亚洲欧洲色天使日韩精品 | 羞羞视频免费观 | 香蕉在线视频网站 | 国产精品亚洲一区二区三区久久 | 窝窝午夜看片免费视频 | 国产精品国产三级在线高清观看 | 大学生美女穿黑色丝袜网站 | 成人特黄午夜性a一级毛片 成人网18免费软件 成人网免费 | 亚洲性夜夜综合久久麻豆 | 中文字幕国产视频 | 国产91精品久久久久久久 | 天天射日日 | 免费色黄网站 | 野花视频在线观看-高清中文 | 日韩视频在线播放 | 欧美视频一区二区专区 | 亚洲中文毛片播九公社 | 一区二区国产在线播放 | www.99视频| 成 黄 色 激 情视频网站 | 欧美一区二区三区在线 | 天堂免费在线视频 | 福利片在线观看免费高清 | 久久成人国产精品免费 | 亚洲日韩中文字幕在线播放 |