官术网_书友最值得收藏!

作者簡介

(署名按作者姓氏拼音排序)

陳果果

清華大學本科學位,約翰霍普金斯大學博士學位,主要研究方向是語音識別及關鍵詞檢索,師從語音識別開源工具Kaldi主要開發(fā)者Daniel Povey,以及約翰霍普金斯大學語言語音處理中心教授Sanjeev Khudanpur。博士期間為Google開發(fā)了Google的喚醒詞Okay Google的原型,現(xiàn)在已經用到數(shù)以億計的安卓設備及Google智能語音交互設備上。博士期間同時參與開發(fā)語音識別開源工具Kaldi,以及神經網絡開源工具CNTK。博士畢業(yè)以后聯(lián)合創(chuàng)辦KITT.AI,專注于語音識別及自然語言處理,公司于2017年被百度收購,目前擔任百度智能生活事業(yè)群組(SLG)主任架構師。

都家宇

本科畢業(yè)于大連理工大學,后于澳大利亞新南威爾士大學電子信息工程學院學習,取得信號處理專業(yè)碩士學位。研究生期間在導師Julien Epps指導下開始進行語音處理、情緒識別方向的研究。畢業(yè)后先后任職于清華大學語音技術實驗室、百度語音技術部,以及阿里巴巴iDST、達摩院語音組,從事聲學模型、解碼器、語音喚醒等方面的研發(fā)工作。參與過與Kaldi相關的工作有:Kaldinnet1神經網絡框架中l(wèi)stm作者;發(fā)起并推動全球最大規(guī)模的中文開源數(shù)據(jù)集語音項目AISHELL-1、AISHELL-2,已服務于清華大學、北京大學、南洋理工大學、哥倫比亞大學等近200所國內外高校的科研項目。

那興宇

本科和博士均畢業(yè)于北京理工大學,主要研究方向是語音識別和語音合成。先后任職于中國科學院聲學研究所和阿里巴巴機器人,從事語音識別模型訓練系統(tǒng)和語音交互系統(tǒng)的開發(fā)。目前就職于微軟,擔任資深應用科學家,從事語音識別算法和技術架構的開發(fā)及業(yè)務支持工作。2015年開始在Kaldi開源項目中貢獻代碼,參與了nnet3和chain模型的開發(fā)工作,并維護其中若干示例及OpenSLR的中文語音識別模型。

張俊博

博士畢業(yè)于中國科學院聲學研究所,師從顏永紅研究員。在小米公司從零起主導構建了整套語音算法研究框架,包括語音識別、智能設備語音喚醒、聲紋識別、語音增強、用于語音應用的神經網絡部署,均達到了當時的先進水平,并發(fā)表頂會論文若干篇,為后續(xù)的語音研發(fā)工作建立了基礎。近期上線了用于外語學習的發(fā)音質量評測引擎,并給Kaldi貢獻了發(fā)音良好度評分的代碼。

主站蜘蛛池模板: 马公市| 新龙县| 杭锦旗| 怀宁县| 昭觉县| 新乡市| 肇东市| 策勒县| 崇仁县| 客服| 合江县| 都昌县| 尼勒克县| 铜梁县| 额尔古纳市| 临安市| 新龙县| 革吉县| 通化县| 都匀市| 偏关县| 娄底市| 阿拉善左旗| 齐河县| 元谋县| 新和县| 诸暨市| 湾仔区| 山阳县| 灵石县| 通化市| 通河县| 驻马店市| 米脂县| 迭部县| 浪卡子县| 道孚县| 孟州市| 铅山县| 嘉善县| 区。|