pg寻龙探宝试玩网站官网

書名：飛槳PaddlePaddle深度學(xué)習(xí)實戰(zhàn)
作者名：劉祥龍等編著
本章字?jǐn)?shù)： 503字
更新時間： 2020-09-28 17:21:34

2.3.2　語音識別

雖然圖像識別是深度學(xué)習(xí)最先嘗試的領(lǐng)域，但語音識別卻最先取得了成功。2009年，深度學(xué)習(xí)的概念被引入語音識別領(lǐng)域，2011年，微軟研究院的鄧力、俞棟和Hinton合作發(fā)布的產(chǎn)品使用深度學(xué)習(xí)技術(shù)擊敗了傳統(tǒng)的高斯混合模型（Gaussian Mixture Model，GMM），取得了不錯的結(jié)果。2012年，谷歌的語音識別模型已經(jīng)全部由GMM更換成深度學(xué)習(xí)模型，并成功將谷歌的語音識別錯誤率降低了20%，改變幅度超過了過去很多年的總和。這一巨大突破主要是因為高斯混合模型是一種淺層學(xué)習(xí)網(wǎng)絡(luò)模型，其建模數(shù)據(jù)特征維數(shù)較小，特征的狀態(tài)空間分布和特征之間的相關(guān)性不能夠被充分描述。采用深度神經(jīng)網(wǎng)絡(luò)后，可以自動在數(shù)據(jù)中提取更加復(fù)雜且有效的特征，樣本數(shù)據(jù)特征間相關(guān)性信息得以充分表示，將連續(xù)的特征信息結(jié)合以構(gòu)成高維特征，通過高維特征樣本對深度神經(jīng)網(wǎng)絡(luò)模型進行訓(xùn)練。

自從發(fā)現(xiàn)了深度學(xué)習(xí)在語音識別方面的出色表現(xiàn)，各大公司紛紛開始了新產(chǎn)品的研發(fā)。蘋果公司Siri系統(tǒng)的語音輸入功能支持包括中文在內(nèi)的20多種語言。微軟公司也基于深度學(xué)習(xí)開發(fā)出了同聲傳譯系統(tǒng)，實現(xiàn)了巨大的技術(shù)突破。國內(nèi)的公司也在不停地做著技術(shù)突破，2016年，百度語音識別準(zhǔn)確率高達97%，并被美國權(quán)威科技雜志《麻省理工評論》列為2016年十大突破技術(shù)之一。

官术网_书友最值得收藏!

飛槳PaddlePaddle深度學(xué)習(xí)實戰(zhàn)

2.3.2 語音識別

2.3.2　語音識別