解鎖行為識別難題,依圖科技再奪一冠


來源:中國產(chǎn)業(yè)經(jīng)濟(jì)信息網(wǎng)   時間:2020-08-04





  繼蟬聯(lián)全球權(quán)威人臉識別競賽冠軍、先后刷新國際聲紋識別權(quán)威競賽(VoxSRC)紀(jì)錄、行人重識別(ReID)三大權(quán)威數(shù)據(jù)集之后,依圖在全球AI技術(shù)賽道再下一城,又攻下一個第一。


  在權(quán)威機(jī)構(gòu)ACM MM’20 Grand Challenge主辦的“大規(guī)模復(fù)雜場景人體視頻解析”挑戰(zhàn)賽中,依圖科技以大幅領(lǐng)先的成績拿下了“Track-4:行為識別”的第一名。

20200804190446311.png

  ACM是全球最大的計算機(jī)領(lǐng)域?qū)I(yè)性學(xué)術(shù)組織,其評選的圖靈獎(A.M.Turing Award)被公認(rèn)為世界計算機(jī)領(lǐng)域的諾貝爾獎。而ACM MM是全球多媒體領(lǐng)域的頂級會議,屬中國計算機(jī)學(xué)會(CCF)指定的A類國際會議。


  在此次挑戰(zhàn)賽中,包括 Amazon、騰訊、大華科技、中山大學(xué)等上百支參賽隊伍參與了超過56000個復(fù)雜事件下的人體行為(包括排隊、打架、俯身、同行、跑動、滯留等)解析。視頻中行為識別是本屆比賽中的重點項目,目的是考察算法在復(fù)雜場景下對行為(包含多人追蹤、人體姿態(tài)、行為識別)的解析能力。


  該賽事是該方向最接近真實場景的大規(guī)模挑戰(zhàn)賽,依圖科技奪冠的同時,其背后的技術(shù)創(chuàng)新和對行為識別難題的攻克一時間備受關(guān)注。


  行為識別究竟有多難?


  如果把人臉識別比作醫(yī)院的“普外門診”的話,行為識別尤其是人類的行為識別,其復(fù)雜度和識別難度不亞于“心血管內(nèi)科+神經(jīng)內(nèi)科”。


  場景復(fù)雜多變、動作差異化大、需要捕捉連續(xù)動作和長時間動作,這些對行為識別和分析都有著巨大的挑戰(zhàn),也就需要算法對行為本身有更精準(zhǔn)的分析推理能力,甚至還能通過既定的場景推算未曾見過的場景。


  結(jié)合此次比賽,行為識別是指以人為基礎(chǔ)單位,只分析人的行為,關(guān)注單人的動作以及多人的動作(例如:一起走路、奔跑、打架等)。學(xué)術(shù)界通常用frame mAP (f-mAP@avg)來作為行為識別的評價指標(biāo),f-mAP@avg代表的含義是以關(guān)鍵幀為單位,評判行為的位置與分類是否準(zhǔn)確;與學(xué)術(shù)界對行為識別的考察指標(biāo)不同,此次競賽的評價標(biāo)準(zhǔn)是wf-mAP@avg,這意味著更注重對難度較大的擁擠場景的考察,以及比較少見的動作的識別,同時對于人體框的定位的精確性要求也更高。


  深度優(yōu)化算法框架,算法性能極致提升


  比賽中,依圖算法的指標(biāo)達(dá)到了wf-mAP@avg 0.26,將以往學(xué)術(shù)界中的基準(zhǔn)算法提升了近3倍。與舉辦了多次的國際競賽不同,這次競賽是首屆,參賽隊伍在賽前也無法了解識別的類別、數(shù)據(jù)集的大小和識別的具體需求,要在短短一個多月的時間內(nèi),設(shè)計出最優(yōu)的算法,并在眾多實力強(qiáng)勁的隊伍中達(dá)到世界第一,難度極高。


  首先,視頻相較于圖像的行為識別更加復(fù)雜,且如何建模、視頻幀之間的相關(guān)性仍是學(xué)術(shù)界一直存在的難題。依圖認(rèn)為,當(dāng)應(yīng)用場景明確后,在已知分析的對象是人體且明確知道要識別的類別后,就可以針對性的進(jìn)行算法優(yōu)化,通過算法定制化來提升算法性能,解決以往不能很好解決的問題。


  與此同時,如同一提到依圖大家就會想到多項人工智能技術(shù)挑戰(zhàn)的世界冠軍,由不同場景帶來的先驗知識和經(jīng)驗,有助于算法對行為的判斷。依圖此次創(chuàng)新性地將算法與場景進(jìn)行了深度結(jié)合。一方面創(chuàng)新性的從視頻中自動提取到了準(zhǔn)確豐富的場景信息,結(jié)合先進(jìn)的行人檢測、行人重識別算法,全面構(gòu)建了人與人、人與場景、人與物之間在視頻中的關(guān)系;另一方面,借助多年來的算法積淀和對行業(yè)場景的理解,依圖對比賽中要求的特定的14類任務(wù)進(jìn)行了深度算法優(yōu)化。


  值得關(guān)注的是,不同于其他參賽隊伍,依圖此次沒有使用復(fù)雜的多模型融合策略,僅用單模型,借助強(qiáng)大的背景提取和分割算法,將行為的解析與場景結(jié)合,就大大降低了問題難度,這也意味著依圖仍可以進(jìn)一步通過融合多個模型提升算法性能。


  依圖在相關(guān)行為上持續(xù)迭代,不斷積累,行為識別算法的性能已遠(yuǎn)超比賽當(dāng)時的算法性能。同時,運用該技術(shù)落地實戰(zhàn)的項目難度也遠(yuǎn)超比賽的數(shù)據(jù)集。


  芯片+算法,加速AI技術(shù)落地


  想象一下,未來運用該技術(shù)如何判斷一個都市夜歸人路遇劫匪而自動報警?如何在家中老人倒地時讓及時預(yù)警并第一時間告知監(jiān)護(hù)人?如何判斷一個生產(chǎn)線上的工人施工順序出錯并即刻發(fā)出告警?如何在一個視頻中對內(nèi)容進(jìn)行精準(zhǔn)理解,并為其貼上更合適的標(biāo)簽使得能夠被更精準(zhǔn)和更容易檢索到?


  在依圖不斷開拓AI新領(lǐng)域的版圖上,相信這些問號背后的答案已逐漸清晰。此前,依圖科技自主研發(fā)的全球首款云端視覺智能芯片求索(questcore?),開啟了算法設(shè)計與芯片設(shè)計相結(jié)合的時代。集合了高性能AI算法和芯片耦合設(shè)計優(yōu)化的芯片平臺,結(jié)合世界領(lǐng)先的行為識別算法的依圖,將更有利于賦能智能城市、安全生產(chǎn)、智能商業(yè)等領(lǐng)域,打造新一代AI基礎(chǔ)設(shè)施。


  近日依圖還通過了由英國標(biāo)準(zhǔn)協(xié)會(即“BSI”)頒發(fā)的ISO/IEC 27701:2019隱私信息管理體系國際認(rèn)證,成為國內(nèi)首家通過認(rèn)證的AI公司。認(rèn)證由國際標(biāo)準(zhǔn)化組織(ISO)和國際電工委員會(IEC)聯(lián)合發(fā)布,是全球首個針對隱私信息管理的國際標(biāo)準(zhǔn),也被公認(rèn)為是最嚴(yán)格、權(quán)威的隱私信息管理標(biāo)準(zhǔn)。獲得該認(rèn)證充分體現(xiàn)了依圖對數(shù)據(jù)隱私保護(hù)的堅持和持續(xù)踐行。


  新基建趨勢下,各行各業(yè)加快數(shù)字化,提升各類工作的智能水平成為剛需。作為目前國內(nèi)唯一具有提供超大規(guī)模、復(fù)雜環(huán)境下億級規(guī)模城市的智能化運營管理技術(shù)能力的人工智能公司,在硬核的技術(shù)實力和隱私保障上的不斷努力已形成一套“組合拳”,也即將加速解鎖更多的智能應(yīng)用。(曉梅)


  轉(zhuǎn)自:中國網(wǎng)

  【版權(quán)及免責(zé)聲明】凡本網(wǎng)所屬版權(quán)作品,轉(zhuǎn)載時須獲得授權(quán)并注明來源“中國產(chǎn)業(yè)經(jīng)濟(jì)信息網(wǎng)”,違者本網(wǎng)將保留追究其相關(guān)法律責(zé)任的權(quán)力。凡轉(zhuǎn)載文章及企業(yè)宣傳資訊,僅代表作者個人觀點,不代表本網(wǎng)觀點和立場。版權(quán)事宜請聯(lián)系:010-65367254。

延伸閱讀

熱點視頻

村里來了服務(wù)隊 ——記棗莊市鄉(xiāng)村振興服務(wù)二隊 村里來了服務(wù)隊 ——記棗莊市鄉(xiāng)村振興服務(wù)二隊

熱點新聞

熱點輿情

特色小鎮(zhèn)

?

微信公眾號

版權(quán)所有:中國產(chǎn)業(yè)經(jīng)濟(jì)信息網(wǎng)京ICP備11041399號-2京公網(wǎng)安備11010502035964