大規(guī)模商用節(jié)點即將突破 語音交互產(chǎn)業(yè)迎爆發(fā)期


來源:中國高新技術(shù)產(chǎn)業(yè)導(dǎo)報   作者:王榮    時間:2016-07-06





  日前舉行的蘋果開發(fā)者大會上,SIRI智能音響與蘋果智能家居平臺Homekit深度融合帶來的語音交互方面的新體驗,成為業(yè)內(nèi)關(guān)注的焦點。這也引發(fā)音響制造廠商、消費電子芯片商、聲學(xué)元件廠商、軟件平臺企業(yè)、家用服務(wù)機(jī)器人公司、平臺內(nèi)容提供商等產(chǎn)業(yè)鏈上眾多公司近期集體有所動作。業(yè)內(nèi)人士表示,歷經(jīng)數(shù)十年發(fā)展,隨著技術(shù)不斷沉淀以及交互場景的不斷拓展,語音技術(shù)發(fā)展即將突破大規(guī)模商用節(jié)點,行業(yè)將進(jìn)入爆發(fā)期。


  新一代人機(jī)交互模式


  “語音交互有望成為下一代人機(jī)交互的新模式?!泵绹畲蟮娘L(fēng)險投資基金合伙人瑪麗·米克爾表示,語音是最有效的計算輸入形式。語音具有快速溝通、簡單方便、個性化且無需鍵盤等特點。隨著技術(shù)不斷成熟,語音交互時代即將到來。


  事實上,語音交互技術(shù)已在逐步商用,如蘋果手機(jī)上的Siri等應(yīng)用。業(yè)內(nèi)人士表示,早期蘋果公司的Siri等語音助手,主要依賴腳本對話,對特定指令做出應(yīng)答。但去年收購VocalIQ技術(shù)后,用戶以會話方式而非過去的提示性語音與設(shè)備交互。


  亞馬遜的Echo音箱熱賣,是語音識別技術(shù)發(fā)展的一個重要標(biāo)志。該款音響可以根據(jù)語音指令回答問題、創(chuàng)建購物清單、播放音樂,甚至能開關(guān)電燈。自2014年發(fā)布以來,該款音響累計銷量突破300萬臺,僅今年第一季度銷量就超過100萬臺。同時,第三方開發(fā)服務(wù)數(shù)量近千項,有望成為亞馬遜下一個10億美元的業(yè)務(wù)。


  對語音識別技術(shù)興起的原因,業(yè)內(nèi)分析師表示,智能手機(jī)在去年迎來爆發(fā)后,計算機(jī)行業(yè)需要一個新的觸發(fā)點。而傳統(tǒng)的交互方式難以全方位滿足用戶需求,以語音交互為基礎(chǔ)構(gòu)成包括圖像、體感在內(nèi)的第三代人機(jī)交互模式有望加速啟動。


  國泰君安分析師認(rèn)為,深度學(xué)習(xí)算法大幅提升語音識別正確率。在語音識別率方面,目前百度、谷歌等主流平臺在單詞語音識別準(zhǔn)確率方面都超過了90%,科大訊飛、云知聲等智能語音識別企業(yè)的識別率達(dá)到96%以上。


  百度首席科學(xué)家吳恩達(dá)表示,如果語音識別準(zhǔn)確率從95%上升到99%,使用人數(shù)將大幅增加。搜索業(yè)務(wù)中,5年后至少50%為圖像搜索或者語音搜索。


  目前語音識別已廣泛應(yīng)用于智能手機(jī)?,旣悺っ卓藸柋硎?,2013-2015年,美國智能手機(jī)用戶使用語音助手的比例從30%上升到65%。谷歌2016年語音搜索量較2008年增加了35倍以上,較2010年增加7倍以上。百度語音從2014年第二季度起,語音輸入增加4倍以上,輸出增加26倍以上。


  融合多種人工智能技術(shù)


  智能語音技術(shù)包括識別和交互環(huán)節(jié),融合了多種人工智能尖端技術(shù)。安信證券分析師認(rèn)為,人機(jī)語音交互應(yīng)用的關(guān)鍵是準(zhǔn)確率與響應(yīng)時間,語音識別技術(shù)日益成熟,即將突破量變到質(zhì)變的臨界點。隨著語音識別技術(shù)和硬件發(fā)展,驅(qū)動語音交互滲透率迅速提升。


  據(jù)了解,亞馬遜的Echo音箱最早只是一個有趣的實驗,目的是測試語音激活功能,并希望通過收集消費者的行為數(shù)據(jù)來制定可行的戰(zhàn)略方案,吸引消費者前往購物。而Echo音箱的銷售大大超出預(yù)期。目前蘋果、谷歌等已經(jīng)發(fā)布類似產(chǎn)品??拼笥嶏w去年與京東成立合資公司,切入點是其新推出的叮咚智能音響。


  隨著語音技術(shù)應(yīng)用范圍不斷擴(kuò)寬,并衍生出一系列對語音交互存在剛性需求的場景。如以可穿戴設(shè)備為代表的小型化、便攜式終端交互;遠(yuǎn)距離、大屏幕終端交互,包括智能電視、智能家居、消費機(jī)器人等;汽車等不方便使用雙手場景中的人機(jī)交互。


  應(yīng)用需求推動技術(shù)進(jìn)步。智能可穿戴設(shè)備屏幕一般不大,甚至沒有觸控屏幕,因此使用語音更加便于人機(jī)交互。如可穿戴設(shè)備的先驅(qū)谷歌眼鏡就搭載了智能語音系統(tǒng)。在網(wǎng)絡(luò)環(huán)境下,可以通過語音發(fā)送短信。隨著可穿戴設(shè)備滲透率不斷提升,語音交互應(yīng)用領(lǐng)域?qū)⒉粩嗤貙挕?/br>


  在大屏領(lǐng)域的應(yīng)用集中在智能電視,康佳、長虹、TCL、LG、樂視等均搭載語音交互功能,通過語音輸入可實現(xiàn)查收影視劇、聽歌、發(fā)送微博、開關(guān)電視等功能。在智能家居領(lǐng)域,搭載語音方案成標(biāo)配。其中,蘋果發(fā)布的智能家居HomeKit采取與Siri協(xié)作的方式,用戶可以使用自然語句發(fā)出命令。隨著家用消費市場興起,語音技術(shù)將迎來更廣闊的市場。


  汽車領(lǐng)域則是另一爭奪焦點。在駕駛汽車過程中,使用按鍵或觸控存在安全隱患,各大車廠在前裝控制系統(tǒng)中搭載了語音控制方案。


  多路資本加快入場


  隨著語音交互技術(shù)的發(fā)展,促使智能家居相關(guān)產(chǎn)品成為焦點,多路資本紛紛加入搶占市場。如谷歌已布局聲控操作智能家居入口系統(tǒng),其語音助手基于人工智能和深度學(xué)習(xí)功能,可應(yīng)用于多種硬件產(chǎn)品;聲控智能硬件產(chǎn)品GoogleHome有望成為智能家居的控制中樞。京東發(fā)布的叮咚智能音響平臺,為基于語音交互控制的智能家居產(chǎn)品,目標(biāo)是打造家庭全數(shù)據(jù)服務(wù)分發(fā)平臺。


  音響的普及帶動了音樂版權(quán)落地。安信證券分析師表示,全球進(jìn)入數(shù)字音樂時代,智能音響滿足聲音的輸出要求。智能語音技術(shù)逐漸成熟,信息的輸入與輸出在智能音響上得到完美詮釋,聲學(xué)將是互聯(lián)網(wǎng)的新入口,基于聲音的商業(yè)模式將得以快速發(fā)展。


  “預(yù)計智能音響行業(yè)有望成為新的互聯(lián)網(wǎng)和物聯(lián)網(wǎng)入口,互聯(lián)網(wǎng)廠商加速切入?!卑残抛C券分析師表示,音樂支出占娛樂消費的18%,商業(yè)模式在數(shù)字時代正在變化,內(nèi)容收費需要與硬件結(jié)合。智能音響更多的價值體現(xiàn)在家庭物聯(lián)網(wǎng)的整合控制和人工智能的實際載體。


  硬件將成為入口,軟件平臺處于產(chǎn)業(yè)核心地位。“未來人工智能將像水和電一樣,融入人們的生活。”科大訊飛相關(guān)負(fù)責(zé)人表示,公司占據(jù)中文語音市場70%以上的份額。該公司針對人與人之間自由交流語音的正確率突破85%實用門檻,針對會議演講等場景達(dá)到95%以上的識別率;同時布局了圖像識別、大數(shù)據(jù)以及腦科學(xué)等領(lǐng)域。



  版權(quán)及免責(zé)聲明:凡本網(wǎng)所屬版權(quán)作品,轉(zhuǎn)載時須獲得授權(quán)并注明來源“中國產(chǎn)業(yè)經(jīng)濟(jì)信息網(wǎng)”,違者本網(wǎng)將保留追究其相關(guān)法律責(zé)任的權(quán)力。凡轉(zhuǎn)載文章,不代表本網(wǎng)觀點和立場。版權(quán)事宜請聯(lián)系:010-65363056。

延伸閱讀

熱點視頻

第六屆中國報業(yè)黨建工作座談會(1) 第六屆中國報業(yè)黨建工作座談會(1)

熱點新聞

熱點輿情

特色小鎮(zhèn)

版權(quán)所有:中國產(chǎn)業(yè)經(jīng)濟(jì)信息網(wǎng)京ICP備11041399號-2京公網(wǎng)安備11010502003583