- 飛槳PaddlePaddle深度學(xué)習(xí)實戰(zhàn)
- 劉祥龍等編著
- 503字
- 2020-09-28 17:21:34
2.3.2 語音識別
雖然圖像識別是深度學(xué)習(xí)最先嘗試的領(lǐng)域,但語音識別卻最先取得了成功。2009年,深度學(xué)習(xí)的概念被引入語音識別領(lǐng)域,2011年,微軟研究院的鄧力、俞棟和Hinton合作發(fā)布的產(chǎn)品使用深度學(xué)習(xí)技術(shù)擊敗了傳統(tǒng)的高斯混合模型(Gaussian Mixture Model,GMM),取得了不錯的結(jié)果。2012年,谷歌的語音識別模型已經(jīng)全部由GMM更換成深度學(xué)習(xí)模型,并成功將谷歌的語音識別錯誤率降低了20%,改變幅度超過了過去很多年的總和。這一巨大突破主要是因為高斯混合模型是一種淺層學(xué)習(xí)網(wǎng)絡(luò)模型,其建模數(shù)據(jù)特征維數(shù)較小,特征的狀態(tài)空間分布和特征之間的相關(guān)性不能夠被充分描述。采用深度神經(jīng)網(wǎng)絡(luò)后,可以自動在數(shù)據(jù)中提取更加復(fù)雜且有效的特征,樣本數(shù)據(jù)特征間相關(guān)性信息得以充分表示,將連續(xù)的特征信息結(jié)合以構(gòu)成高維特征,通過高維特征樣本對深度神經(jīng)網(wǎng)絡(luò)模型進行訓(xùn)練。
自從發(fā)現(xiàn)了深度學(xué)習(xí)在語音識別方面的出色表現(xiàn),各大公司紛紛開始了新產(chǎn)品的研發(fā)。蘋果公司Siri系統(tǒng)的語音輸入功能支持包括中文在內(nèi)的20多種語言。微軟公司也基于深度學(xué)習(xí)開發(fā)出了同聲傳譯系統(tǒng),實現(xiàn)了巨大的技術(shù)突破。國內(nèi)的公司也在不停地做著技術(shù)突破,2016年,百度語音識別準(zhǔn)確率高達97%,并被美國權(quán)威科技雜志《麻省理工評論》列為2016年十大突破技術(shù)之一。
- Visual Studio 2012 Cookbook
- OpenStack Cloud Computing Cookbook(Fourth Edition)
- Python數(shù)據(jù)可視化之Matplotlib與Pyecharts實戰(zhàn)
- 程序員修煉之道:通向務(wù)實的最高境界(第2版)
- Learning Data Mining with R
- C程序設(shè)計實踐教程
- Visual Basic程序設(shè)計
- 運用后端技術(shù)處理業(yè)務(wù)邏輯(藍橋杯軟件大賽培訓(xùn)教材-Java方向)
- C和C++游戲趣味編程
- Mastering Backbone.js
- 代替VBA!用Python輕松實現(xiàn)Excel編程
- 深入分析GCC
- WCF技術(shù)剖析(卷1)
- Python第三方庫開發(fā)應(yīng)用實戰(zhàn)
- VMware vSphere Design Essentials