官术网_书友最值得收藏!

推薦序

本書專門講述如何將深度學習方法,特別是深層神經網絡(DNN)技術應用于自動語音識別(ASR)領域。在過去的幾年中,深層神經網絡技術在語音識別領域的應用取得了前所未有的成功。這使得本書成為在深層神經網絡技術的發展歷程中一個重要的里程碑。作者繼其前一本書Deep Learning:Methods and Applications(《深度學習·方法與應用》)之后,在語音識別技術和應用上進行了更深入的鉆研,得成此作。與上一本書不同,本書并沒有對深度學習的各個應用領域都進行探討,而將重點放在語音識別技術及其應用上,并就此進行更深入、更專一的討論。難能可貴的是,本書提供許多語音識別技術背景知識,以及深層神經網絡的技術細節,比如嚴謹的數學描述和軟件實現也都包含其中。這些對語音識別領域的專家和有一定基礎的讀者來說都將是極其珍貴的資料。

本書的獨特之處還在于,它的內容并沒有局限在目前常應用于語音識別技術的深層神經網絡上,還兼顧了深度學習中的生成模型,這種模型可以很自然地嵌入先驗的領域知識和問題約束。作者在背景材料中充分證實了自20世紀90年代早期起,語音識別領域研究者提出的深度動態生成模型(dynamic generative models)的豐富性,同時將其與最近快速發展的深度鑒別性模型在統一的框架下進行了比較。書中以循環神經網絡和隱動態模型為例,對這兩種截然不同的深度模型進行了全方位有見地的優劣比較。這為語音識別中的深度學習發展和其他信號及信息處理領域開啟了一個新的激動人心的方向。該書還滿懷歷史情懷地對四代語音識別技術進行分析。當然,以深度學習為主要內容的第四代技術是本書所詳細闡述的,特別是DNN和深度生成模型的無縫結合,將使得知識擴展可以在一種最自然的方式下完成。

總的來說,本書可能成為語音識別領域工作者在第四代語音識別技術時代的重要參考書。全書不但巧妙地涵蓋了一些基本概念,使讀者能夠理解語音識別全貌,還對近兩年興盛起來的強大的深度學習方法進行了深入地介紹。讀完本書,讀者將可以看清前沿的語音識別是如何構建在深層神經網絡技術上的,可以滿懷自信地去搭建識別能力達到甚至超越人類的語音識別系統。

Sadaoki Furui
芝加哥豐田技術研究所所長,東京理工學院教授

主站蜘蛛池模板: 商南县| 洮南市| 阿城市| 任丘市| 电白县| 炉霍县| 永康市| 上虞市| 汤阴县| 乌鲁木齐市| 绥阳县| 开封县| 漳州市| 潞西市| 习水县| 灵丘县| 柏乡县| 泸定县| 沙田区| 麦盖提县| 寿光市| 靖州| 承德市| 广宗县| 阿城市| 颍上县| 松江区| 荥阳市| 枣庄市| 嘉禾县| 龙江县| 禹州市| 温宿县| 合江县| 托克托县| 昆山市| 九江县| 沅江市| 承德县| 富民县| 堆龙德庆县|