6月24日,2023年度國(guó)家科學(xué)技術(shù)獎(jiǎng)在京揭曉,共評(píng)選出250個(gè)項(xiàng)目。其中,由科大訊飛股份有限公司牽頭,聯(lián)合中國(guó)科學(xué)技術(shù)大學(xué)、清華大學(xué)、華為終端有限公司、中移(杭州)信息技術(shù)有限公司等高校及行業(yè)領(lǐng)軍企業(yè)聯(lián)合完成的“多語(yǔ)種智能語(yǔ)音關(guān)鍵技術(shù)及產(chǎn)業(yè)化”項(xiàng)目榮獲2023年度國(guó)家科技進(jìn)步獎(jiǎng)一等獎(jiǎng)。
據(jù)了解,多語(yǔ)種智能語(yǔ)音技術(shù)對(duì)于支撐人機(jī)交互、人類語(yǔ)言互通等具有重大戰(zhàn)略意義,產(chǎn)業(yè)前景廣闊。
為解決語(yǔ)音識(shí)別研究中遠(yuǎn)場(chǎng)、噪聲、多人語(yǔ)音混疊等難題,該項(xiàng)目提出了多通道語(yǔ)音信號(hào)時(shí)空分離建模方法和多維度語(yǔ)音屬性解耦表征方法,實(shí)現(xiàn)語(yǔ)音信號(hào)中內(nèi)容、噪聲等高度耦合的多維屬性特征解耦,使得復(fù)雜場(chǎng)景下語(yǔ)音識(shí)別準(zhǔn)確率得到重大突破。
為應(yīng)對(duì)小語(yǔ)種智能語(yǔ)音系統(tǒng)構(gòu)建所面臨的知識(shí)匱乏、訓(xùn)練數(shù)據(jù)稀缺等難題,科大訊飛設(shè)計(jì)了全新的多語(yǔ)種通用音素體系和基本語(yǔ)言單元,實(shí)現(xiàn)多語(yǔ)種統(tǒng)一音素韻律體系的構(gòu)建,又通過(guò)基于元學(xué)習(xí)的多語(yǔ)種預(yù)訓(xùn)練和基于語(yǔ)族分組的多語(yǔ)種共享建模。通俗地說(shuō),就是將不同的小語(yǔ)種進(jìn)行分類,找到同類語(yǔ)種的共同規(guī)律,進(jìn)行分析建模和訓(xùn)練,最終顯著提升了小語(yǔ)種語(yǔ)音系統(tǒng)性能。
同時(shí),為解決復(fù)雜應(yīng)用場(chǎng)景下語(yǔ)音交互、語(yǔ)音翻譯面臨著深層次語(yǔ)義理解困難、專業(yè)性不足等問(wèn)題,科大訊飛提出語(yǔ)音語(yǔ)義互增強(qiáng)的魯棒口語(yǔ)理解技術(shù),有效提升語(yǔ)音交互、語(yǔ)音翻譯等復(fù)雜場(chǎng)景的語(yǔ)義理解準(zhǔn)確率;提出多源知識(shí)增強(qiáng)的可信文本生成技術(shù),提升專有詞匯及領(lǐng)域知識(shí)引用的準(zhǔn)確率。
目前,該技術(shù)成果得到廣泛應(yīng)用。以智能手機(jī)為例,項(xiàng)目支持各主流手機(jī)廠商累計(jì)激活設(shè)備超10億臺(tái);智能汽車方面,車載智能化產(chǎn)品累計(jì)前裝超5300萬(wàn)套。此外,該項(xiàng)目還構(gòu)建了多語(yǔ)種智能語(yǔ)音技術(shù)及全球產(chǎn)業(yè)生態(tài),2017年開(kāi)始承建的智能語(yǔ)音國(guó)家新一代人工智能開(kāi)放創(chuàng)新平臺(tái),已聚集平臺(tái)開(kāi)發(fā)者數(shù)700.7萬(wàn),終端設(shè)備數(shù)40.5億。(記者 郭倩)
轉(zhuǎn)自:經(jīng)濟(jì)參考網(wǎng)
【版權(quán)及免責(zé)聲明】凡本網(wǎng)所屬版權(quán)作品,轉(zhuǎn)載時(shí)須獲得授權(quán)并注明來(lái)源“中國(guó)產(chǎn)業(yè)經(jīng)濟(jì)信息網(wǎng)”,違者本網(wǎng)將保留追究其相關(guān)法律責(zé)任的權(quán)力。凡轉(zhuǎn)載文章及企業(yè)宣傳資訊,僅代表作者個(gè)人觀點(diǎn),不代表本網(wǎng)觀點(diǎn)和立場(chǎng)。版權(quán)事宜請(qǐng)聯(lián)系:010-65363056。
延伸閱讀
版權(quán)所有:中國(guó)產(chǎn)業(yè)經(jīng)濟(jì)信息網(wǎng)京ICP備11041399號(hào)-2京公網(wǎng)安備11010502035964