Vincent Vanhoucke是Google的首席迷信家,斯坦福年夜學電子工程學博士,今朝在Google Brain主導機械人相干的項目。Vanhoucke重要的研討范疇是語音辨認、盤算機視覺和機械人等范疇,他還行將掌管機械人范疇的嘉會CoRL 2017(Conference on Robot Learning)。
Vanhoucke以為,機械智能如今曾經成長到一個相當的水準,在某些特定情境下的表示可以媲美(乃至超出)人類,好比機械視覺、機械翻譯、語音辨認,如今是時刻讓這些才能在物理世界中施展效應了。他在明天的演講中提到,robotics的研討如今也正面對著一場深度進修的改革,完成這一點,須要如今的機械進修從業者跳出監視進修的溫馨區,面對一些辣手的成績:數據稀缺,若何使機械完成技巧轉換和連續性的進修等等。Vanhoucke也提到,這也是人工智能從實際到理論的必經之路。
Vanhoucke說,2011年,語音辨認研討者采取神經收集技巧下降語音辨認,毛病率年夜幅下降,是語音辨認范疇十多年來最年夜的提高;2016年,簡直就曾經到達人類水準了。
而機械翻譯,2014年機械進修的引入也讓機械翻譯有了質的提高,但要說到達人類水準,照樣比擬委曲……
?。磌eynote上的名單,為Google的機械翻譯做出進獻的,華人數目很多。)
這個柱狀圖是人類翻譯、神經收集翻譯和PBMT翻譯的質量差異,順次遞加。
Vanhoucke以為,機械進修研討比曩昔更輕易了,有更多的開源對象和模子,更多的收集教程(他本身就在Udacity上開了收集課程),GPU和高機能盤算硬件門坎也變低了,研討者也比之前更多。
圖片辨認范疇,除底層技巧的完美,Google曾經將圖片辨認技巧運用在醫療范疇,贊助大夫診斷病情,而且取得了一些成效。
但他也說,圖象辨認如今遠遠沒有到“succes”的田地,有40%基于圖象監測做的決議計劃,成果是很蹩腳的。
接上去是機械人的部門。Vanhoucke是電子工程專業出生,在Google Brain重要的任務是機械人項目。他先強調了一個和許多人認知有收支的不雅點:今朝的機械人研討其實跟深度進修沒有多年夜關系。
他做了個示范,讓手里的筆失落在地上,說,假如機械人的義務是抓取筆的話,那末捉住了和抓不住,從內部不雅察不到機械人的舉措有甚么差異(按:是以不克不及從中獲得甚么紀律)。
機械抓取特定的物體是有跡可循的,抓取未知的物體還沒有法處理。(Vanhoucke播了一段機械人摔交集錦視頻,說曩昔他認為這些機械人摔交很可笑,然則后來本身開端做機械人項目以后,看到這類畫面就再也笑不出來了。研討機械抓取真的很難,但他很enjoy。)
越是少的圖象辨認技巧參與,機械的魯棒性就越好,能應對更龐雜的物體。后續有聽眾問及抓取對象的數據庫時,Vanhoucke說他們(Google)其實不愿望樹立一個如許的常識圖譜。
強化進修的引入關于機械人的研討能夠有贊助,條件是先有一個能發生海量樣本的參照模子。
最初的結論:
1、robotics和機械進修正在產生成心思的融會;
2、關于慣例的robotics成績,要有做出分歧謎底的覺醒;
3、It hits all the right difficult problems on the road to practical AI。