6月24日,紅星新聞?dòng)浾邚某啥既诵螜C(jī)器人創(chuàng)新中心了解到,該中心近日發(fā)布了中國(guó)首個(gè)基于視覺擴(kuò)散架構(gòu)的人形機(jī)器人任務(wù)生成式模型R-DDPRM(Raydiculous-Denoise Diffusion Probabilistic Robot Model)。
“大家所熟知的文生視頻模型OpenAI SORA、SVD,文生圖模型SD,OpenAI Dall-E等業(yè)界知名模型,就是基于擴(kuò)散架構(gòu)的垂直模型。”張睿睿介紹,這些模型都擁有強(qiáng)大的理解、推理和生成能力。擴(kuò)散架構(gòu)應(yīng)用于人形機(jī)器人核心技術(shù)研發(fā),將重構(gòu)人形機(jī)器人底層架構(gòu),釋放人形機(jī)器人的決策技能,使其在操縱和泛化方面達(dá)到前所未有的高度。他稱,目前全球范圍內(nèi)僅有少數(shù)人形機(jī)器人團(tuán)隊(duì)發(fā)布相關(guān)階段性成果。
據(jù)介紹,目前業(yè)界的人形機(jī)器人任務(wù)生成式模型主要基于VAE、AC Transformer、LSTM等架構(gòu),這類架構(gòu)下的人形機(jī)器人通常在規(guī)劃動(dòng)作時(shí)考慮單一約束類型,例如物體抓持穩(wěn)定性或規(guī)避障礙物路徑規(guī)劃,這就需要針對(duì)每種細(xì)分情況都要對(duì)應(yīng)開發(fā)和執(zhí)行一系列單獨(dú)的垂直模型(并聯(lián)線性),遇到執(zhí)行問(wèn)題需要局部調(diào)整試錯(cuò)來(lái)緩慢推進(jìn)任務(wù)進(jìn)程,推理效率低、執(zhí)行速度慢且大量消耗算力。R-DDPRM模型的創(chuàng)新之處在于能夠讓人形機(jī)器人跨越多個(gè)約束進(jìn)行泛化,創(chuàng)造了真正的人形機(jī)器人“大腦”——能夠毫不猶豫“絲滑”地處理各種復(fù)雜任務(wù)。
張睿睿表示,該模型具有同時(shí)確定拿起物體的最佳抓持位姿、移動(dòng)物體最佳路線、能耗最少最佳等多要素全局規(guī)劃思維能力,并能在人為破壞任務(wù)進(jìn)程時(shí)迅速進(jìn)行決策修正和調(diào)整執(zhí)行方式,接續(xù)完成任務(wù)。該模型的泛化能力能讓人形機(jī)器人自主流暢地完成各種復(fù)雜任務(wù)。
據(jù)了解,成都人形機(jī)器人創(chuàng)新中心是我國(guó)中西部地區(qū)首個(gè)人形機(jī)器人創(chuàng)新中心,是四川省人工智能一號(hào)創(chuàng)新工程的首個(gè)原點(diǎn)項(xiàng)目,致力于打造具有國(guó)際領(lǐng)先水平的“有腦子”的人形機(jī)器人。
——信息來(lái)自:紅星新聞