原創(chuàng) 要聞 證券 基金 保險 銀行 上市公司 IPO 科創(chuàng)板 汽車 新三板 科技 房地產(chǎn)

“你穿個馬甲我就不認(rèn)識你了?”如何讓AI操作可形變物體


中國產(chǎn)業(yè)經(jīng)濟(jì)信息網(wǎng)   時間:2021-06-17





圖蟲創(chuàng)意-921688101898551345.jpg

  識別和處理變形物體是人類日常生活中不可或缺的一部分,如疊衣服、處理食材等簡單任務(wù)都會涉及到。 然而這對AI來說卻并不簡單。小品里“小樣,你穿個馬甲我就不認(rèn)識你了?”對AI來說,還真不是一個笑話。認(rèn)識是同一物體之后,還得能夠操作。

  近日,來自瑞典皇家理工學(xué)院的研究團(tuán)隊在《科學(xué)》(Sience)子刊上發(fā)表了題為《可變形物體操縱的建模、學(xué)習(xí)、感知和控制方法》的論文,研究團(tuán)隊調(diào)查了這一領(lǐng)域的100多項(xiàng)相關(guān)研究,采用學(xué)習(xí)視角來整合對分析方法和數(shù)據(jù)驅(qū)動方法的討論,探索如何解決在感知和操縱各種可變形對象中使用和集成模型先驗(yàn)和任務(wù)數(shù)據(jù)的問題。研究者認(rèn)為,數(shù)據(jù)驅(qū)動方法的最新進(jìn)展,以及經(jīng)典的控制和規(guī)劃,可以為這些開放的挑戰(zhàn)提供可行的解決方案。此外,隨著更好的模擬環(huán)境開發(fā),可以允許對各種方法進(jìn)行基準(zhǔn)測試,更好地理解需要進(jìn)行哪些理論開發(fā),以及如何實(shí)施和評估實(shí)際系統(tǒng),以提供靈活、可擴(kuò)展和具有魯棒性(robust)的解決方案。

  盡管AI對可變形物體的操作很重要,但由于與之相關(guān)的建模、感知和控制的整體復(fù)雜性,相對于剛性物體的操作,此前人們上對可變形物體的機(jī)器人操作的研究較少。計算機(jī)圖形學(xué)和機(jī)器學(xué)習(xí)的最新進(jìn)展提供了有價值的建模技術(shù)和數(shù)據(jù)驅(qū)動范式,可以幫助克服傳統(tǒng)方法在變形對象操作中的一些限制。

  最近關(guān)于物體抓取和操作的調(diào)查發(fā)現(xiàn),與變形物體的物理交互是機(jī)器人領(lǐng)域中一個重要的開放問題。它進(jìn)一步證明了學(xué)習(xí)和數(shù)據(jù)驅(qū)動的方法為機(jī)器人在可變形物體操作方面具有更先進(jìn)的能力鋪平了道路。

  文章從“基于物理的可變形對象建?!遍_始,具體詳舉了質(zhì)量-彈簧系統(tǒng)、基于位置的動力學(xué)、連續(xù)介質(zhì)力學(xué)以及基于物理的仿真器。

  可變形物體的建模和模擬動力學(xué)通常依賴于使用粒子或網(wǎng)格的幾何表示。

  質(zhì)量-彈簧系統(tǒng)(MSSs)將可變形材料作為一個網(wǎng)絡(luò)模型。質(zhì)量分配給每個單獨(dú)的頂點(diǎn),頂點(diǎn)與彈簧邊相互連接。

  基于位置的動力學(xué)(PBD)是一種無網(wǎng)格方法,建模材料作為一個離散系統(tǒng)的粒子。

  連續(xù)介質(zhì)力學(xué)為連續(xù)域中的材料變形建模提供了更精確的物理描述。

  在基于物理的建模方面,作者例舉了Simulation Open Framework Architecture(SOFA)、PhysX、MuJoCo。

  Simulation Open Framework Architecture(SOFA)是一個開源框架,專為組織模式開發(fā)用于組織建模和手術(shù)干預(yù)。它采用模塊化設(shè)計,為不同的機(jī)械對象、約束和碰撞幾何圖形提供定制的解算器。SOFA提供內(nèi)置質(zhì)量彈簧模型。它還包括各種FEM模型,例如線性、共旋線性和新胡克模型,用于醫(yī)學(xué)應(yīng)用中的精度。該框架已用于運(yùn)動規(guī)劃、跟蹤可變形物體和基于視覺的尖端力估計。

  PhysX是NVIDIA的開源產(chǎn)品,用于游戲引擎。它的特點(diǎn)是基于PBD的布料建模,允許模擬剛性和布狀物品,而不需要如中那樣橋接不同的模擬器。隨著對摩擦接觸處理的擴(kuò)展,PhysX已被用于人類著裝中的各種任務(wù),例如觸覺和力預(yù)測,它也被用作規(guī)劃穿衣運(yùn)動的正向動力學(xué)模型。

  MuJoCo具有凸軟接觸模型,因此允許具有較高收斂速度的優(yōu)化方法。由于該模擬器最初以關(guān)節(jié)型機(jī)器人的建模為目標(biāo),因此它為加速機(jī)器人建模和學(xué)習(xí)算法提供了有用的接口。其變形動力學(xué)建模已被Bullet是一個用于碰撞檢測和多體模擬的開源庫。它建立在PBD的基礎(chǔ)上,以模擬可變形物體及其與其他世界實(shí)體的相互作用。

  第二部分是感知(Perception)??勺冃挝矬w的控制和操作依賴于使用視覺、力、觸覺和距離感知的豐富和魯棒的感知。作者列舉了基于模版的方法,如幾何模型、基于物理的模型、參數(shù)識別以及基于特定應(yīng)用的表示等。

  在數(shù)據(jù)驅(qū)動方法中,動態(tài)模型不是先驗(yàn)定義的,而是學(xué)習(xí)的,它通常被公式化為監(jiān)督學(xué)習(xí)問題. 這些方法涉及模型預(yù)測的可靠性,借助定制特征、壓縮表示和模型架構(gòu)先驗(yàn)進(jìn)行學(xué)習(xí)。作者例舉了可變形對象交互的控制策略、模仿學(xué)習(xí)、強(qiáng)化學(xué)習(xí)。

  第三部分關(guān)于操縱(Manipulation)。由于建模和仿真技術(shù)的進(jìn)步,可變形物體操作的規(guī)劃已經(jīng)從使用特定任務(wù)的幾何圖形,如2D形狀輪廓,轉(zhuǎn)移到使用一般物理模型。

  關(guān)于可變形物體的建模、感知和控制的工作仍處于初級階段,但最近大量的工作證明了它的重要性。根據(jù)高維狀態(tài)空間和可變形材料的復(fù)雜動力學(xué),研究者確定了可變形物體操縱的主要挑戰(zhàn)。仿真技術(shù)的進(jìn)步也使得狀態(tài)估計和運(yùn)動規(guī)劃等各種應(yīng)用成為可能。更重要的是基于學(xué)習(xí)的方法的興起證明了它們作為補(bǔ)充范式的靈活性和有效性。最近的趨勢開始融合這兩種范式,用數(shù)據(jù)補(bǔ)償建模不足的方面,或者用模型先驗(yàn)促進(jìn)學(xué)習(xí)性能。先驗(yàn)可以類似于作為結(jié)構(gòu)的分析模型,或者通過模擬器提供任務(wù)數(shù)據(jù)。(見習(xí)記者:邵文)



  轉(zhuǎn)自:澎湃新聞

  【版權(quán)及免責(zé)聲明】凡本網(wǎng)所屬版權(quán)作品,轉(zhuǎn)載時須獲得授權(quán)并注明來源“中國產(chǎn)業(yè)經(jīng)濟(jì)信息網(wǎng)”,違者本網(wǎng)將保留追究其相關(guān)法律責(zé)任的權(quán)力。凡轉(zhuǎn)載文章及企業(yè)宣傳資訊,僅代表作者個人觀點(diǎn),不代表本網(wǎng)觀點(diǎn)和立場。版權(quán)事宜請聯(lián)系:010-65363056。

延伸閱讀

熱點(diǎn)視頻

“十三五”期間我國高技術(shù)制造業(yè)增長迅猛 “十三五”期間我國高技術(shù)制造業(yè)增長迅猛

熱點(diǎn)新聞

熱點(diǎn)輿情

?

微信公眾號

版權(quán)所有:中國產(chǎn)業(yè)經(jīng)濟(jì)信息網(wǎng)京ICP備11041399號-2京公網(wǎng)安備11010502035964