天堂色网-天堂色综合-天堂社区在线观看-天堂社区在线视频-天天操网-天天操网站

 
當前位置: 首頁 » 行業資訊 » 機器人»李飛飛新研究:基于深度學習和視覺化語言來了解不同物體間的關系
   

李飛飛新研究:基于深度學習和視覺化語言來了解不同物體間的關系

 46.1K
     [點擊復制]
放大字體  縮小字體 發布日期:2017-10-30   瀏覽次數:1026
核心提示:  2017將來迷信年夜獎頒獎儀式暨將來服裝論壇t.vhao.net年會28、29日在京舉行,斯坦福年夜學畢生傳授、谷歌云首席迷信家李飛飛在人工智能研究會上表現,比來她地點的試驗室正在做一項新研討,基于深度進修和視覺化

  2017將來迷信年夜獎頒獎儀式暨將來服裝論壇t.vhao.net年會28、29日在京舉行,斯坦福年夜學畢生傳授、谷歌云首席迷信家李飛飛在人工智能研究會上表現,比來她地點的試驗室正在做一項新研討,基于深度進修和視覺化說話形式懂得分歧物體之間的關系。

李飛飛新研究:基于深度學習和視覺化語言來了解不同物體間的關系

  李飛飛表現,不管是植物智能照樣機械智能,視覺都長短常主要的技巧。視覺是人腦中最為龐雜的體系,占領年夜腦中50%的熟悉單元。視覺反響速度異常快,只須要150微秒。這使得圖象辨認技巧變得異常主要但又非常龐雜。

  曩昔8年時光,圖象辨認的毛病率下降了10倍。2012年對GPU和深度辨認技巧的懂得讓這一范疇完成了沖破。然則,在一個圖集中,要取得數據和物體之前關系的信息仍然很難,今朝所能做的任務都非常無限。李飛飛地點試驗室正在為霸占這一范疇睜開新的研討。

  她羅列了一張圖中的算法,這類算法可以猜測分歧物體之間的空間關系,停止比較,懂得這類對稱的關系,然后懂得物體之間的舉措,和它們的之間地位關系。物體之間還能有甚么樣的數據集,供給一個標簽,停止短句子描寫。停止進一步懂得視覺世界,而不只僅是一系列的物體稱號,試驗室正在做相干量化研討。

  以下是李飛飛演講實錄,enjoy:

  明天我給年夜家帶來的是比來的一些研討思緒,明天我的演講內容是關于視覺智能,植物世界傍邊有許多物種,并且有一種異常了不得,絕年夜多半植物都有眼睛,是以視覺是最為主要的一種感不雅的辦法和認知辦法,這是在植物的年夜腦傍邊,贊助植物活著界傍邊生計上去停止溝通,去操控和生計。

  所以我們不管是評論辯論植物智能或許是機械智能的話,視覺長短常主要的基石。世界上所存在的這些體系傍邊,最為懂得的一點是我們所曉得的人類視覺體系。所以在5億多年前的時刻,這個退化曾經賡續地讓我們的視覺體系賡續地成長,使得我們的視覺體系異常主要的去懂得這個世界,并且這是我們年夜腦傍邊最為龐雜的體系,并且有50%的年夜腦傍邊的這些認知的單元,都有著最為龐雜、最為高等的感知體系,所以可以或許讓我們曉得人類的視覺體系異常了不得。

  這是認貼心理學家做過的一個最為有名的一個試驗,這也就是告知年夜家人類的視覺系統有何等了不得,年夜家看一下這個視頻,你的義務是假如看到一小我的話就舉手,這是一個智商測試。所以每一個圖景的時光長短常短的,也就是1/10秒,不只如許,并且讓年夜家看一小我的話,并沒有告知你是甚么樣的人,或許他站在哪里,甚么樣的姿態,穿甚么樣的衣服,但是年夜家依然能很快地辨認出這小我。

  1996年的時刻,Newl(音譯)傳授先生證實出視覺認知才能是人類年夜腦傍邊最為了不得的才能,由于速度異常快,并且年夜概是150微秒,在150微秒以內,我們的年夜腦可以或許差別異常龐雜的圖象。會把異常龐雜的含植物和不含植物的圖象差別出來,誰人時刻盤算機沒有接近人類的,這類任務鼓勵著盤算機迷信家,愿望處理最為根本的成績就是圖象辨認成績。

  過了20年到如今,盤算機范疇和專家也在這個成績上創造了幾代技巧,這個就是我們所懂得到的這些圖集,固然也獲得了異常年夜的停頓和提高。這張圖表是給年夜家總結一下,在曩昔的幾年傍邊,在分類挑釁傍邊一些標記性的項目,橫軸是時光年份,右邊縱軸指的是分類毛病。我們可以或許看到它的毛病是下降了10倍。8年的時光里毛病率就下降了十倍,所以這八年傍邊閱歷了異常年夜的反動。

  2012年的時刻懂得了GPU技巧,和深度辨認技巧,贊助世界懂得在深層進修反動的一個成長,所以異常使人沖動的范疇,特別曩昔幾十年在人工智能的研討。作為迷信家就會想一下在這個圖集以外,還可以做到甚么。

  經由過程一個例子告知年夜家,兩張圖片,包含一個植物和一小我,經由過程圖象辨認來看這兩個圖異常類似,然則他們的故事倒是異常分歧的,固然你確定不想在左邊的圖的場景傍邊,我們在這就會涌現一個異常主要的成績,就是人們可以或許做的,這也是最為主要、最為基本的一點圖象辨認功效,就是辨認圖象物體之間的關系,起首這個輸出是圖象自己,然則我們所輸入的信息包含物體的地位和物體之間的關系。固然這個范疇有一些后期任務,然則絕年夜多半任務都是比擬無限的。取得數據和物體之間的關系信息比擬無限。

  比來我們的試驗傍邊做了如許一項任務,開端新的研討,猜測依據深度進修,和視覺化說話形式懂得分歧物體之間的關系。

  這張圖的算法可以或許猜測分歧物體之間的空間關系,停止比較,懂得這類對稱的關系,然后懂得他們之間的舉措,和他們的之間地位關系。所以這就是一個更加豐碩的辦法,懂得我們的視覺世界,而不只僅是一系列的物體稱號,這是我們所做出的一些量化研討。解釋我們的任務在賡續地停頓和獲得提高的。

  一年前的時刻,我們曉得這個范疇成長異常快,就是關于盤算機圖象辨認方面。我們也曉得有許多新的研討曾經跨越了我們的研討結果。

  我們可以看一下,在他們之間的關系是甚么,并且在這個圖象傍邊分歧物體的關系,可以或許讓我們去更進一步懂得這個成績,就是在物體之間還會有甚么樣的數據集。最開端我們曉得有這個抽象,異常無限的信息,好比這是一個物體,COCO進一步進修,供給一個標簽,停止短句子描寫,視覺數據信息長短常龐雜和異常多的,

  依據門路出來一些問答,經由三年的研討,我們發明可以有更加豐碩的辦法來描寫這些內容,經由過程這些分歧的標簽,描寫這些物體,包含他們的性質、屬性和關系,然后經由過程如許的一個圖譜樹立起他們之間的接洽。可以在這看一下這個內容。如許一個數據庫傍邊,包含上千個標簽,包含屬性和關系,還有句子、問答信息,在我們如許一個信息庫傍邊,可以或許異常準確地讓我們來停止加倍準確的研討,而不只僅曉得物體辨認自己。

  我們若何往來來往應用如許的圖表呢?我們做過的一個任務,就是我們看一下這個場景的搜刮,年夜家不管在百度照樣在Google搜刮中,搜刮過圖象或許圖集,好比可以輸出穿西裝的男性,可以展示出許多的圖,假如輸出心愛的小狗的話,有許多相似的圖會涌現,這一點異常好。同時看一下他們處理了甚么成績呢?能否處理了圖象搜刮的成績呢?我們輸出一個句子,男性穿戴西裝,抱著心愛的小狗,剎時成果不是特殊好了。絕年夜多半搜刮引擎的這類算法,在搜刮圖象的時刻,能夠許多照樣僅僅應用物體自己的信息,他們只是簡略地懂得這個圖有甚么物體,然則這是不敷的。

  假如我想搜刮一個坐在椅子上的男性的話,假如物體自己給我們一小我抽象或許椅子抽象再能加上更多的屬性,加上更多的信息,這個成果就會更好一些。

  2015年的時刻,我們開端去摸索一種新的出現辦法,我們可以去輸出異常長的描寫性的段落,放到年夜型的數據庫傍邊,然后來把它和我們的圖象停止比較,我們經由過程這類算法可以或許贊助我們停止很好的搜刮,這就遠遠地跨越了我們在明天的這個圖象搜刮技巧傍邊所看到的成果。

  這個看起來異常好,然則年夜家會有一個成績,在哪里可以或許找到這些場景圖象呢?確切異常龐雜,并且很難贊助我們構建起一個場景圖,所以我們是手動地去構建如許一個場景,這個進程將會異常復雜,所以我們下一步的任務,我們就是愿望可以或許涌現主動地發生場景圖的一個技巧。所以我們有如許一個主動的體系,固然是經由過程這類迭代的信息傳遞的形式,并且應用這類深度進修的出現辦法,固然太細節的內容在這不給年夜家講了,然則要給年夜祖傳遞的一個主要信息。我們本年炎天的時刻的一個結果就是我們這個辦法在場景圖這方面的搜刮結果是比現行的激活技巧要更好的。

  經由過程如許一種場景圖,會給我們供給一個四層的進程,并且讓我們更好地懂得場景信息,然則照樣不敷的。并且現實上到如今為止,我們僅僅摸索了認貼心理學家所評論辯論的一個概念,人們在一眼當中可以或許看到甚么樣的內容,有甚么樣的概念,人們只需看一眼就可以看出全部圖象傍邊的故事,所以我們要去看一下,這類只看一下圖就可以夠懂得它重要信息的才能是甚么呢?在我之前,已經做過一個研討,就是愿望人們可以或許告知我們,你看到了這個圖的時刻看到了甚么內容,所以這是我們的試驗場景,試驗人員坐在電腦屏幕眼前,給它異常冗長地看一些圖象,然后很快地去看別的的一個圖象,去隱瞞之前留下的印象。他們須要打印出本身所看到的一切內容,做這個任務給他們付10美元,如今不給年夜家一小時10美元,年夜家可以試驗一下這個感到,假如你是加入我的試驗人員的話。

  在這個圖傍邊其實很快可以或許被一張簡略的門路去蓋失落,很短的出現時光,只要27奧妙,27奧妙相當因而1/40秒,簡略圖形的時光是半秒的時光,是更長的,人們照樣可以或許很好地輿解場景信息,根本上是很短的時光。假如我給的試驗費用更高的話,年夜家乃至能做的更好。在這個說話傍邊有異常豐碩的元素,不只僅看到圖象傍邊的物體是甚么,他們的關系是甚么,并且有更多的內容。

  2015年開端,我們有別的一個概念,叫做LSTM,他們愿望把說話之間關系樹立起來,我們在電腦傍邊給他們一個圖象,可以或許描寫,穿橙色任務服的工人站在路上任務,或許穿黑色T恤的男士在彈吉他,不只僅用冗長的句子描寫圖形,所今后來停止進一步的任務,就是深度捕捉。看每一個短句,描寫一個部門,然后描寫圖象的場景。

  除這個以外,我們本年所做的任務,我們愿望把這些圖象要用這些短語,讓它成為小短的句子,成為一個小段落,給了更多的內容,并且和認貼心理學家所做的試驗傍邊,人類的描寫成果長短常接近的。然則我們并沒有只停于這里,在上個周的ICCB的下面展現了一個視頻,異常豐碩的研討區域,許多收集上的視頻,有各類各樣的數據情勢,懂得這些視頻長短常主要的。在外面可以描寫更長故事的片斷,用異樣的模子可以如許做,可以把時光的元素參加到外面。

  這就是一個例子,年夜家可以看一下,可以看到視頻是在停止著的,我們也能夠去描寫每個部門是怎樣樣的。

  這是別的一個例子,也是描寫了這個演員正在做的這些工作,差不多年夜家能明確甚么意思了。

  別的一個部門,除簡略的認知之外就是推理,推理可讓我們可以或許回到人工智能的最后,在20世紀七八十年月的時刻,人工智能的前驅們,用了許多推理,斯坦福年夜學的一個傳授也是把他的研討稱為一個塊狀的世界,這外面觸及到許多的深度推理。藍色照樣不錯的,愛好這些藍色的塊狀,不愛好白色的塊狀,不愛好支持三角形的器械,究竟愛好不愛好灰色的盒子呢?所以這里有許多推理須要去做的,然后夠得出一個準確的謎底。

  固然時光過得很快,不克不及講的特殊具體,然則我們在試驗室里也是用了這些簡略的對象,來描寫如許一個分塊狀的世界。這外面也有許多的問答列表,每一個問答列表都是觸及到推理的進程傍邊,最癥結的一些環節,包含空間的一些關系,一些邏輯關系,在這外面也有一些問答例子。

  客歲,我們也是把這些智能的問答集做成了如許一個體系,人類能做若干,機械能做若干,在精確下面的一個比較。我們究竟怎樣可以或許做得更好呢?這也是比來我們做的一個任務,在ICCB揭橥的。我們用了一個新的法式去做,在我們的算法外面,我們把這些成績輸出出去,然后把法式停止一些調和,還有履行的引擎,用猜測的一些法式停止履行的處置。經由過程如許一個算法,我們可以看到這些進修的精確率。

  有哪些進修模塊呢?起首斷定究竟這些物體外形怎樣樣,這些紫色是甚么樣的,這是一個加倍龐雜的,就是在灰色的這些模塊旁邊,有若干發光的這些物體?得出的成果是2。

  我給年夜家分享的就是一系列的任務,有哪些可以或許超出我們視覺的一些門路,其實我們在懂得參預景,還有其他的一些要素,關于全部的認知會發生甚么樣的影響,除這個情形、視覺、說話,還有許多推理等等,這些都是很主要的。

  最初,用這張圖來停止,這是20周年夜的一個小女孩,跟著她的認知世界的成長,她經由過程許多游戲,她也能夠經由過程畫畫和各類玩具,來和世界樹立認知,這是認知視覺的智能,關于我們的懂得、交換、協作、互動等等,視覺智能都長短常異常癥結的,讓我們開端摸索這個世界。

只要你關注機器人,你就無法錯過睿慕課

 
 
 
[ 行業資訊搜索 ]  [ 加入收藏 ]  [ 告訴好友 ]  [ 打印本文 ]  [ 關閉窗口 ]
 
 
主站蜘蛛池模板: 亚洲va精品中文字幕 | 豆国产97在线 | 中国 | 午夜视频在线 | 黄色网址在线免费看 | 成人午夜影视全部免费看 | 日韩手机在线免费视频 | 一级成人毛片免费观看 | 国产成人精品一区二三区2022 | 狠狠色噜噜狠狠狠狠97 | 手机看片日韩国产 | 国产欧美一区二区三区观看 | 欧美乱大交xxxx | 久久精品国产99久久6动漫欧 | 日韩精品一区二区三区中文字幕 | 欧美成人精品 | 日韩不卡中文字幕 | 国产高清片 | 久久成人免费大片 | 天天夜天天干 | a资源在线观看 | 国产毛片毛片精品天天看 | 日韩手机在线免费视频 | 成人免费看视频 | 97色伦图片在线观看 | 波多野吉衣在线多野结衣 | 在线午夜视频 | 小明日韩在线看看永久区域 | 最近免费中文字幕大全免费 | 成人欧美视频在线观看 | 欧美视频在线一区二区三区 | 日本一区二区不卡视频 | 天天摸夜夜摸狠狠摸夜夜摸 | 日韩精品小视频 | 欧美亚洲国产精品久久久久 | 五月婷婷伊人 | 日本二区在线观看 | 男人使劲桶女人下面动态图片 | 欧美不卡在线 | 中文字幕日本一本二本三区 | 青春草视频在线观看免费 | 殴美一级视频 |