天堂色网-天堂色综合-天堂社区在线观看-天堂社区在线视频-天天操网-天天操网站

 
當(dāng)前位置: 首頁 » 行業(yè)資訊 » 智能制造»第四范式首席科學(xué)家楊強教授:未來人工智能會讓二流科學(xué)家失業(yè);
   

第四范式首席科學(xué)家楊強教授:未來人工智能會讓二流科學(xué)家失業(yè);

 46.1K
     [點擊復(fù)制]
放大字體  縮小字體 發(fā)布日期:2016-09-13   瀏覽次數(shù):400
核心提示:楊強,第四范式聯(lián)合創(chuàng)始人、首席科學(xué)家。楊強教授在人工智能研究領(lǐng)域深耕三十年,是國際公認的人工智能全球頂級學(xué)者,ACM杰出科
          楊強,第四范式聯(lián)合創(chuàng)始人、首席科學(xué)家。楊強教授在人工智能研究領(lǐng)域深耕三十年,是國際公認的人工智能全球頂級學(xué)者,ACM杰出科學(xué)家,兩屆「KDDCup」冠軍。現(xiàn)任香港科技大學(xué)計算機與工程系主任,是首位美國人工智能協(xié)會(AAAI)華人院士,AAAI執(zhí)行委員會唯一的華人委員,國際頂級學(xué)術(shù)會議KDD、IJCAI等大會主席,IEEE大數(shù)據(jù)期刊等國際頂級學(xué)術(shù)期刊主編。楊強教授在數(shù)據(jù)挖掘、人工智能、終身機器學(xué)習(xí)和智能規(guī)劃等研究領(lǐng)域都有卓越的貢獻,是遷移學(xué)習(xí)領(lǐng)域的奠基人和開拓者,他發(fā)表論文400余篇,論文被引用超過兩萬次。

  近日,機器之心對楊強教授進行了專訪,他對遷移學(xué)習(xí)、人工智能行業(yè)與技術(shù)進行了深入講解,并對人工智能從業(yè)者提供了眾多有價值的建議。

  楊強教授

  關(guān)于遷移學(xué)習(xí)

  機器之心:您目前主要從事哪方面的研究工作?

  楊強:我現(xiàn)在做的一項研究是把深度學(xué)習(xí)、強化學(xué)習(xí)和遷移學(xué)習(xí)結(jié)合起來,讓深度學(xué)習(xí)有目標(biāo)。基于有目標(biāo)的延遲反饋的機器學(xué)習(xí)在現(xiàn)有的深度學(xué)習(xí)中做的不是太好,比如RNN能夠解決序列到序列的學(xué)習(xí)(Sequenceto Sequence Learning),但它比較短視,沒有最終目標(biāo)和最終反饋。這就會出現(xiàn)很多問題,比如說推薦系統(tǒng)就沒有辦法在對話中有效地,自然地使用。同時,在自然語言對話中,只會出現(xiàn)毫無目的的閑聊,使得用戶體驗會不太好。要改變這些問題,就一定要引入強化學(xué)習(xí),這樣才可以進行推理并具有長期的目標(biāo)。同時在這些算法之上再加一個遷移學(xué)習(xí)的算法層。這樣,可以把一個通用的學(xué)習(xí)模型「個性化」到每個人不同的需求和興趣上。這是我們目前所聚焦的研究領(lǐng)域。

  機器之心:提到不同學(xué)習(xí)方法的結(jié)合,ACM8月份CACM(communication of the ACM)刊文《強化學(xué)習(xí)的復(fù)興(Reinforcement Renaissance)》,深度學(xué)習(xí)和強化學(xué)習(xí)結(jié)合的深度強化學(xué)習(xí)帶來了更好的表現(xiàn),您之前也在演講中提過兩者的結(jié)合,能具體解釋一下嗎?

  楊強:強化學(xué)習(xí)原來特別地難以有效的擴展,這是因為它的狀態(tài)空間太大;另外,這些狀態(tài),都是憑某個專家的經(jīng)驗來人為地定義的,而并不是學(xué)習(xí)出來的。但是,現(xiàn)在通過和深度學(xué)習(xí)的結(jié)合,我們可以把強化學(xué)習(xí)的目標(biāo)和反饋拿出來,把規(guī)劃的目標(biāo)轉(zhuǎn)化成一個學(xué)習(xí)的目標(biāo),即lost function,而用來訓(xùn)練一個「端到端的」深度學(xué)習(xí)系統(tǒng)。DeepMind在這方面就做的比較成功。這樣,深度學(xué)習(xí)就有目的性了,因為可以得到有效的反饋機制來幫助學(xué)習(xí)。

  但是,我們也要看到,這樣做了以后,缺點也隨之出現(xiàn)——比如說DeepMind那個模型,它是不可解釋的,因此很難把人的經(jīng)驗放進去,也很難在這個強化學(xué)習(xí)模型上面做任何的「知識短路」,即個性化。我們看到,遷移學(xué)習(xí)是在狀態(tài)空間上的一種知識短路,這是我們的一個新發(fā)現(xiàn):即遷移學(xué)習(xí)更容易在知識結(jié)構(gòu)上從小數(shù)據(jù)中學(xué)習(xí)。這樣,在應(yīng)用中,可以先訓(xùn)練一個深度學(xué)習(xí)和強化學(xué)習(xí)的合并模型,然后用近似的方法把狀態(tài)顯現(xiàn)化,最后,再在這個近似空間的轉(zhuǎn)移中做一個遷移學(xué)習(xí)模型。這就是我們現(xiàn)在所做的研究。

  機器之心:能否介紹一下遷移學(xué)習(xí)這幾年發(fā)展的亮點以及現(xiàn)階段的研究難點,比如您之前提到過的「兩個領(lǐng)域衡量標(biāo)準(zhǔn)」問題。

  楊強:遷移學(xué)習(xí)在這幾年有挺大突破,比如它和深度學(xué)習(xí)的結(jié)合。遷移學(xué)習(xí)的一個發(fā)現(xiàn)就是用特征做遷移效果非常好,關(guān)鍵是怎么找到這些好的特征將兩個領(lǐng)域給結(jié)合起來,換句話說,就是要找到合適的遷移機制。我們可以通過什么把知識從一個領(lǐng)域遷移到另外一個領(lǐng)域呢?我們發(fā)現(xiàn)最好就是找到一些比較通用的特征,比如說在大陸這邊,汽車的駕駛員坐在左邊,而在香港駕駛員坐在右邊。那么,你怎么讓一個大陸的駕駛員一來到香港就馬上就適應(yīng),而回到大陸又可以迅速調(diào)整回來,做到左右逢源呢?那就需要找到一個知識的表達方式——即駕駛員和馬路的關(guān)系的表達——司機的位置如果是靠路中間,那不管在大陸還是在香港都肯定沒錯。而這種通用的表達方式就是深度學(xué)習(xí)可以幫你找到的。當(dāng)你把兩個不同領(lǐng)域都作為輸入給深度學(xué)習(xí)系統(tǒng),它會幫你找到一個共同的不變的表達,然后就可以通過這個不變量來做遷移。
  所以,遷移學(xué)習(xí)在最近的一個進展就是,通過深度學(xué)習(xí)發(fā)現(xiàn)不同隱含層有不同的遷移能力,比如說,在音頻上偏高層就比較容易遷移;視頻上偏低層比較容易遷移,但每一層能遷移的知識和量不一樣。這樣我們對遷移能力就能有了定量認識,又往前走了一步。這只是一個很好的研究方向。但是遷移學(xué)習(xí)目前比較難的一點,是衡量兩個領(lǐng)域之間的距離。過去的研究,學(xué)者們只是靠純統(tǒng)計的方法。而現(xiàn)在,有了深度學(xué)習(xí)以后,就可以把在不同層次的特征拿過來,發(fā)現(xiàn)不同層次的距離是不一樣的,而利用這些不同的「知識點」來理解遷移學(xué)習(xí)的能力。這一點是一個新的突破口。

  機器之心:最近有一項關(guān)于用遷移學(xué)習(xí)研究非洲貧困的案例,斯坦福研究者回避了其他收集成本過高的指標(biāo),而是使用衛(wèi)星圖像獲取的燈光信息來判斷貧困程度,您如何看待里面的技術(shù),以及此項研究本身涉及的意義呢?

  楊強:是的,這是個很有趣的案例。在這個案例里,燈光就變成了一個不變量。它能反映貧富,又能反映路段,只要預(yù)訓(xùn)練燈光,就可以把這段知識遷移到那段去,這是一個很好的例子。但有特別需要說明的一點是,這是其中一種遷移學(xué)習(xí)的手段,叫傳遞式遷移,是說從a到b到c三個領(lǐng)域的傳遞,這個鏈條可以任意的長,從1到N。其實我們?nèi)粘V卸荚谟眠@種方式,比如學(xué)生第一學(xué)期上的課和最后一個學(xué)期上的課就可以看成一個遷移鏈條,上完這門課再上下一門,很多知識就可以被遷移和應(yīng)用,新東西學(xué)起來就覺得容易,課程一個個過來就可以畢業(yè)了。我們?nèi)祟愐呀?jīng)在使用這種方式——把一個難的問題分解成一系列問題。

  機器之心:目前遷移學(xué)習(xí)的研究成果在哪些領(lǐng)域應(yīng)用的比較好?

  楊強:遷移學(xué)習(xí)在好幾個領(lǐng)域都能發(fā)揮作用,比如說電商上面的推薦,你做了一個領(lǐng)域的推薦模型,當(dāng)出現(xiàn)一個新的領(lǐng)域時,就可以遷移過去,這兩個領(lǐng)域有區(qū)別,但有些是共通的。

  第一個應(yīng)用的例子是推薦系統(tǒng)里的一個非常棘手的問題,就是「冷啟動」。就是說,在沒有任何用戶數(shù)據(jù)的情況下,我們?nèi)绾文軌蜃屜到y(tǒng)推薦的結(jié)果還不錯?一個做法是,可以從一個類似的領(lǐng)域遷移過來。第二個是「個性化」:每個人都希望在手機上了解我們的智能助手,「懂我」的意思就是已經(jīng)基于你的需求進行個性化了。使用遷移學(xué)習(xí)就可以利用你的數(shù)據(jù)從一個通用模型遷移到你的個人模型。第三應(yīng)用領(lǐng)域是小數(shù)據(jù),大家都知道大數(shù)據(jù)可以用深度學(xué)習(xí)做,但大數(shù)據(jù)的獲取只有少數(shù)大公司才能做到,而大部分公司是沒有這個資源的,他們只有小數(shù)據(jù),有個辦法就是從大數(shù)據(jù)獲得的模型往小數(shù)據(jù)遷移。第四個是可以用在隱私方面,我們?nèi)绻馨岩粋€大數(shù)據(jù)的模型實現(xiàn)本地化。這樣,就沒有必要去把本地隱私的數(shù)據(jù)上傳到云端,而個人隱私就可以獲得保護,我覺得這是解決隱私問題最有效的一個方式,如果遷移學(xué)習(xí)能解決的話,那加密、利用隨機擾亂等技術(shù)來保護隱私的辦法都不用做了,因為這些方法對模型的效果影響很大。

  機器之心:關(guān)于隱私,您在2015年發(fā)了一篇關(guān)于差分隱私(Differential Privacy)的文章。隨著您剛才提到的「個性化人工智能」的推進,敏感數(shù)據(jù)的隱私問題日漸受到更多關(guān)注。您能基于當(dāng)時那篇文章講解一下嗎?

  楊強:這是當(dāng)時在華為諾亞方舟實驗室和上海聯(lián)通合作的一個項目。我們在電信數(shù)據(jù)的挖掘上,發(fā)現(xiàn)數(shù)據(jù)挖掘中一個很受追捧的概念就是「差分隱私」技術(shù)。這個概念在學(xué)術(shù)界很流行,但我們發(fā)現(xiàn)在工業(yè)上,它的應(yīng)用卻很少。這個算法在實際問題中用不了的原因,是它沒有考慮一個重要因素:一方面要保護隱私,另一方面要保證模型的表現(xiàn)不下降。如果保護的多,那模型的效果就會下降的就特別多,而這種效果的下降是可以用錢來衡量的。而隱私如果也能換成錢,那么,就可以在這兩者間做一個權(quán)衡。但是,從來沒有人這么做過。所以我們當(dāng)時寫了一篇論文來指出了這一點。也就是,過去大家一味的去關(guān)心隱私其實是一種偏頗,而隱私的問題應(yīng)該把效果和價值來綜合來考慮。差分隱私在學(xué)術(shù)界是一種很優(yōu)秀的做法,但可能不適合工業(yè)界,因為在工業(yè)界需要從效果總體上進行權(quán)衡。

  機器之心:遷移學(xué)習(xí)可以實現(xiàn)「舉一反三」(和人類智能類似),這好像與我們要實現(xiàn)的人工智能終極目標(biāo)最為相似,那如果接下來人工智能要取得突破,遷移學(xué)習(xí)會成為其中最關(guān)鍵的路徑嗎?

  楊強:遷移學(xué)習(xí)只是路徑之一,應(yīng)該說,更重要的是表達學(xué)習(xí),即學(xué)習(xí)知識的表達。遷移是知識表達的一個試金石:如果表達找的好,那就遷移的好,深度學(xué)習(xí)是表達的一個路徑,但不是唯一路徑。如果要把知識表達進行分解的話,其中的遷移能力是特別重要的,比如能做比喻學(xué)習(xí)(learning by analogy)等。

  關(guān)于人工智能行業(yè)

  機器之心:您在大企業(yè)研究院(華為諾亞方舟、微信聯(lián)合實驗室)、高校(HKUST)和創(chuàng)業(yè)公司(第四范式)進行研究,這些機構(gòu)在研發(fā)方法和目標(biāo)上有何異同?

  楊強:在工業(yè)界應(yīng)該是應(yīng)用研究,更多著眼把一個技術(shù)實用化以產(chǎn)生價值,而這個技術(shù)最好今天就解決問題;大學(xué)是長遠的,更理論化的研究,目標(biāo)比較高遠,大學(xué)的研究所應(yīng)該做明天要做的事情。現(xiàn)在我看到一個現(xiàn)象是,公司有實驗室在做大學(xué)的事情,大學(xué)有實驗室做公司的事情,我預(yù)計這些很難成功。因為他們都在做別人應(yīng)該做的事情。如果公司做純高校的事情一定長久不了,他們要產(chǎn)生價值,公司無法去養(yǎng)這么多學(xué)者。
   機器之心:您提到過人工智能的五個條件:清晰的商業(yè)目標(biāo)、高品質(zhì)的大數(shù)據(jù)資源、清晰的問題定義和領(lǐng)域邊界、了解人工智能跨界人才、強大的硬件計算能力。「第四范式」這個公司目前在做的金融行業(yè)對此非常符合,能否透露一下,公司下一個重點拓展的行業(yè)是什么?

  楊強:金融可能是我們的第一個點,但第四范式的重要目標(biāo)是做一個平臺,這個平臺能夠讓大眾變成人工智能應(yīng)用者,大家只要自己有數(shù)據(jù)和應(yīng)用問題,想利用這個平臺,都可以來用。為什么先選擇金融領(lǐng)域,傳統(tǒng)金融領(lǐng)域需求比較大,門檻比較高,如果在這個領(lǐng)域成為一個領(lǐng)先者就很容易保持優(yōu)勢,有了這個優(yōu)勢之后可以鋪開做。

  機器之心:科技巨頭對人工智能創(chuàng)業(yè)公司的收購越來越頻繁,這是否會加劇您提到的「人工智能是富人的游戲」這種現(xiàn)象?對于第四范式來說,考慮過被巨頭收購的可能嗎?

  楊強:這肯定會加劇,相信一些創(chuàng)業(yè)公司聚集了一批優(yōu)秀人才,但是也存在有些創(chuàng)業(yè)公司的目的就是被巨頭收購,最后逐漸就變成巨頭一統(tǒng)天下了,小的諸侯國被吞并,秦朝統(tǒng)一六國,這并不有利于百花齊放。

  那對于第四范式來說,我們匯聚了機器學(xué)習(xí)領(lǐng)域的優(yōu)秀科學(xué)家、工程師和咨詢專家,從實戰(zhàn)中不斷優(yōu)化研發(fā)與服務(wù)水平。目前第四范式在工業(yè)界發(fā)展非常好,我們也希望它在科學(xué)上不負眾望,能夠規(guī)避人工智能被個別的集團所壟斷的風(fēng)險、從而引導(dǎo)人工智能走向大眾,為社會所用,這也是我作為一個科學(xué)家的使命。

  機器之心:現(xiàn)在看到有種趨勢,比如說從論文發(fā)表來看,公司在人工智能的某些前沿研究上已經(jīng)超過了高校。

  楊強:因為公司現(xiàn)在有資本有數(shù)據(jù),所以吸引了很多人,這些人是沖著資源去的,比如說數(shù)據(jù)和機器,這是現(xiàn)在的一個階段。但是比如說理論研究問題,目前我們對深度學(xué)習(xí)本身的理解還不夠深,如果要解決這個問題,就不應(yīng)該在公司做。但是你要去實現(xiàn)大規(guī)模的深度學(xué)習(xí)系統(tǒng),利用大數(shù)據(jù)去做一件前人沒有做的事情,那一定要在公司做,在大學(xué)做不了。

  但特別要指出的是,我經(jīng)歷了很多公司,發(fā)現(xiàn)它們并不是像外界所想的那樣就一定有數(shù)據(jù),很多數(shù)據(jù)其實是大學(xué)來找更加方便,因為大學(xué)是中立的、非盈利機構(gòu),大家更樂意把數(shù)據(jù)給出來。

 
 
 
[ 行業(yè)資訊搜索 ]  [ 加入收藏 ]  [ 告訴好友 ]  [ 打印本文 ]  [ 關(guān)閉窗口 ]
 
 
展會更多+
視頻更多+
點擊排行
 
網(wǎng)站首頁 | 網(wǎng)站地圖 | 排名推廣 | 廣告服務(wù) | 積分換禮 | 網(wǎng)站留言 | RSS訂閱
主站蜘蛛池模板: 做久爱视频在线观看 | 日本国产最新一区二区三区 | 99re在线这里只有精品 | 亚洲免费视频网址 | 国产精选在线播放 | 天天拍天天干 | 亚洲欧美日韩天堂在线观看 | 精品视频免费播放 | 亚洲成人在线网 | 日韩综合一区 | 天天插天天射天天操 | 国内精品久久久久久影院老狼 | 亚洲天堂网站 | 日本黄色小视频在线观看 | 久草视频中文 | 三级大片在线观看 | 日本一区二区在线 | 久久精品国产亚洲a不卡 | 欧美videos另类极品 | 欧美日韩无线码免费播放 | 毛片xxxx| 久久影视一区 | 在线观看欧美日韩 | 日本欧美一区二区三区在线 | 黄色片在线观看免费 | 禁网站在线观看免费视频 | 天天做天天爽爽快快 | 人人狠人人透人人爱 | 日韩成人在线影院 | 999任你躁在线精品免费不卡 | 一级毛片牲交大片 | 亚洲另类网 | 午夜伦理在线观看 | 玖玖爱zh综合伊人久久 | 黄色网址免费在线观看 | 有人有片的观看免费视频 | 欧美在线黄 | 男女黄色毛片 | 日韩欧美一区二区三区免费看 | 青草午夜精品视频在线观看 | 在线天堂中文在线资源网 |