官术网_书友最值得收藏!

2.3.2 語音識別

雖然圖像識別是深度學(xué)習(xí)最先嘗試的領(lǐng)域,但語音識別卻最先取得了成功。2009年,深度學(xué)習(xí)的概念被引入語音識別領(lǐng)域,2011年,微軟研究院的鄧力、俞棟和Hinton合作發(fā)布的產(chǎn)品使用深度學(xué)習(xí)技術(shù)擊敗了傳統(tǒng)的高斯混合模型(Gaussian Mixture Model,GMM),取得了不錯的結(jié)果。2012年,谷歌的語音識別模型已經(jīng)全部由GMM更換成深度學(xué)習(xí)模型,并成功將谷歌的語音識別錯誤率降低了20%,改變幅度超過了過去很多年的總和。這一巨大突破主要是因為高斯混合模型是一種淺層學(xué)習(xí)網(wǎng)絡(luò)模型,其建模數(shù)據(jù)特征維數(shù)較小,特征的狀態(tài)空間分布和特征之間的相關(guān)性不能夠被充分描述。采用深度神經(jīng)網(wǎng)絡(luò)后,可以自動在數(shù)據(jù)中提取更加復(fù)雜且有效的特征,樣本數(shù)據(jù)特征間相關(guān)性信息得以充分表示,將連續(xù)的特征信息結(jié)合以構(gòu)成高維特征,通過高維特征樣本對深度神經(jīng)網(wǎng)絡(luò)模型進行訓(xùn)練。

自從發(fā)現(xiàn)了深度學(xué)習(xí)在語音識別方面的出色表現(xiàn),各大公司紛紛開始了新產(chǎn)品的研發(fā)。蘋果公司Siri系統(tǒng)的語音輸入功能支持包括中文在內(nèi)的20多種語言。微軟公司也基于深度學(xué)習(xí)開發(fā)出了同聲傳譯系統(tǒng),實現(xiàn)了巨大的技術(shù)突破。國內(nèi)的公司也在不停地做著技術(shù)突破,2016年,百度語音識別準(zhǔn)確率高達97%,并被美國權(quán)威科技雜志《麻省理工評論》列為2016年十大突破技術(shù)之一。

主站蜘蛛池模板: 屏南县| 皋兰县| 望谟县| 威信县| 嘉荫县| 大理市| 涟水县| 洛川县| 盐山县| 买车| 永清县| 和田市| 那坡县| 宁德市| 新宁县| 喜德县| 内江市| 左权县| 石门县| 清水县| 阿尔山市| 当阳市| 新绛县| 仁布县| 大名县| 福州市| 奈曼旗| 上蔡县| 怀来县| 罗田县| 洞口县| 香河县| 河南省| 延长县| 蒙山县| 大同县| 宿松县| 萝北县| 湛江市| 沂水县| 铁力市|