大規(guī)模商用節(jié)點即將突破 語音交互產(chǎn)業(yè)迎爆發(fā)期


來源:中國高新技術產(chǎn)業(yè)導報   作者:王榮    時間:2016-07-06





  日前舉行的蘋果開發(fā)者大會上,SIRI智能音響與蘋果智能家居平臺Homekit深度融合帶來的語音交互方面的新體驗,成為業(yè)內(nèi)關注的焦點。這也引發(fā)音響制造廠商、消費電子芯片商、聲學元件廠商、軟件平臺企業(yè)、家用服務機器人公司、平臺內(nèi)容提供商等產(chǎn)業(yè)鏈上眾多公司近期集體有所動作。業(yè)內(nèi)人士表示,歷經(jīng)數(shù)十年發(fā)展,隨著技術不斷沉淀以及交互場景的不斷拓展,語音技術發(fā)展即將突破大規(guī)模商用節(jié)點,行業(yè)將進入爆發(fā)期。


  新一代人機交互模式


  “語音交互有望成為下一代人機交互的新模式?!泵绹畲蟮娘L險投資基金合伙人瑪麗·米克爾表示,語音是最有效的計算輸入形式。語音具有快速溝通、簡單方便、個性化且無需鍵盤等特點。隨著技術不斷成熟,語音交互時代即將到來。


  事實上,語音交互技術已在逐步商用,如蘋果手機上的Siri等應用。業(yè)內(nèi)人士表示,早期蘋果公司的Siri等語音助手,主要依賴腳本對話,對特定指令做出應答。但去年收購VocalIQ技術后,用戶以會話方式而非過去的提示性語音與設備交互。


  亞馬遜的Echo音箱熱賣,是語音識別技術發(fā)展的一個重要標志。該款音響可以根據(jù)語音指令回答問題、創(chuàng)建購物清單、播放音樂,甚至能開關電燈。自2014年發(fā)布以來,該款音響累計銷量突破300萬臺,僅今年第一季度銷量就超過100萬臺。同時,第三方開發(fā)服務數(shù)量近千項,有望成為亞馬遜下一個10億美元的業(yè)務。


  對語音識別技術興起的原因,業(yè)內(nèi)分析師表示,智能手機在去年迎來爆發(fā)后,計算機行業(yè)需要一個新的觸發(fā)點。而傳統(tǒng)的交互方式難以全方位滿足用戶需求,以語音交互為基礎構成包括圖像、體感在內(nèi)的第三代人機交互模式有望加速啟動。


  國泰君安分析師認為,深度學習算法大幅提升語音識別正確率。在語音識別率方面,目前百度、谷歌等主流平臺在單詞語音識別準確率方面都超過了90%,科大訊飛、云知聲等智能語音識別企業(yè)的識別率達到96%以上。


  百度首席科學家吳恩達表示,如果語音識別準確率從95%上升到99%,使用人數(shù)將大幅增加。搜索業(yè)務中,5年后至少50%為圖像搜索或者語音搜索。


  目前語音識別已廣泛應用于智能手機。瑪麗·米克爾表示,2013-2015年,美國智能手機用戶使用語音助手的比例從30%上升到65%。谷歌2016年語音搜索量較2008年增加了35倍以上,較2010年增加7倍以上。百度語音從2014年第二季度起,語音輸入增加4倍以上,輸出增加26倍以上。


  融合多種人工智能技術


  智能語音技術包括識別和交互環(huán)節(jié),融合了多種人工智能尖端技術。安信證券分析師認為,人機語音交互應用的關鍵是準確率與響應時間,語音識別技術日益成熟,即將突破量變到質變的臨界點。隨著語音識別技術和硬件發(fā)展,驅動語音交互滲透率迅速提升。


  據(jù)了解,亞馬遜的Echo音箱最早只是一個有趣的實驗,目的是測試語音激活功能,并希望通過收集消費者的行為數(shù)據(jù)來制定可行的戰(zhàn)略方案,吸引消費者前往購物。而Echo音箱的銷售大大超出預期。目前蘋果、谷歌等已經(jīng)發(fā)布類似產(chǎn)品??拼笥嶏w去年與京東成立合資公司,切入點是其新推出的叮咚智能音響。


  隨著語音技術應用范圍不斷擴寬,并衍生出一系列對語音交互存在剛性需求的場景。如以可穿戴設備為代表的小型化、便攜式終端交互;遠距離、大屏幕終端交互,包括智能電視、智能家居、消費機器人等;汽車等不方便使用雙手場景中的人機交互。


  應用需求推動技術進步。智能可穿戴設備屏幕一般不大,甚至沒有觸控屏幕,因此使用語音更加便于人機交互。如可穿戴設備的先驅谷歌眼鏡就搭載了智能語音系統(tǒng)。在網(wǎng)絡環(huán)境下,可以通過語音發(fā)送短信。隨著可穿戴設備滲透率不斷提升,語音交互應用領域將不斷拓寬。


  在大屏領域的應用集中在智能電視,康佳、長虹、TCL、LG、樂視等均搭載語音交互功能,通過語音輸入可實現(xiàn)查收影視劇、聽歌、發(fā)送微博、開關電視等功能。在智能家居領域,搭載語音方案成標配。其中,蘋果發(fā)布的智能家居HomeKit采取與Siri協(xié)作的方式,用戶可以使用自然語句發(fā)出命令。隨著家用消費市場興起,語音技術將迎來更廣闊的市場。


  汽車領域則是另一爭奪焦點。在駕駛汽車過程中,使用按鍵或觸控存在安全隱患,各大車廠在前裝控制系統(tǒng)中搭載了語音控制方案。


  多路資本加快入場


  隨著語音交互技術的發(fā)展,促使智能家居相關產(chǎn)品成為焦點,多路資本紛紛加入搶占市場。如谷歌已布局聲控操作智能家居入口系統(tǒng),其語音助手基于人工智能和深度學習功能,可應用于多種硬件產(chǎn)品;聲控智能硬件產(chǎn)品GoogleHome有望成為智能家居的控制中樞。京東發(fā)布的叮咚智能音響平臺,為基于語音交互控制的智能家居產(chǎn)品,目標是打造家庭全數(shù)據(jù)服務分發(fā)平臺。


  音響的普及帶動了音樂版權落地。安信證券分析師表示,全球進入數(shù)字音樂時代,智能音響滿足聲音的輸出要求。智能語音技術逐漸成熟,信息的輸入與輸出在智能音響上得到完美詮釋,聲學將是互聯(lián)網(wǎng)的新入口,基于聲音的商業(yè)模式將得以快速發(fā)展。


  “預計智能音響行業(yè)有望成為新的互聯(lián)網(wǎng)和物聯(lián)網(wǎng)入口,互聯(lián)網(wǎng)廠商加速切入?!卑残抛C券分析師表示,音樂支出占娛樂消費的18%,商業(yè)模式在數(shù)字時代正在變化,內(nèi)容收費需要與硬件結合。智能音響更多的價值體現(xiàn)在家庭物聯(lián)網(wǎng)的整合控制和人工智能的實際載體。


  硬件將成為入口,軟件平臺處于產(chǎn)業(yè)核心地位。“未來人工智能將像水和電一樣,融入人們的生活?!笨拼笥嶏w相關負責人表示,公司占據(jù)中文語音市場70%以上的份額。該公司針對人與人之間自由交流語音的正確率突破85%實用門檻,針對會議演講等場景達到95%以上的識別率;同時布局了圖像識別、大數(shù)據(jù)以及腦科學等領域。



  版權及免責聲明:凡本網(wǎng)所屬版權作品,轉載時須獲得授權并注明來源“中國產(chǎn)業(yè)經(jīng)濟信息網(wǎng)”,違者本網(wǎng)將保留追究其相關法律責任的權力。凡轉載文章,不代表本網(wǎng)觀點和立場。版權事宜請聯(lián)系:010-65363056。

延伸閱讀

熱點視頻

第六屆中國報業(yè)黨建工作座談會(1) 第六屆中國報業(yè)黨建工作座談會(1)

熱點新聞

熱點輿情

特色小鎮(zhèn)

版權所有:中國產(chǎn)業(yè)經(jīng)濟信息網(wǎng)京ICP備11041399號-2京公網(wǎng)安備11010502003583