官术网_书友最值得收藏!

  • 中國語音學報(第11輯)
  • 中國社會科學院語言研究所主辦
  • 1072字
  • 2021-01-06 19:11:10

4.程序運行

在setting.ini文件中設置好各項參數(shù)之后,雙擊xSegmenter.exe即可運行,但建議在Dos命令行窗口中執(zhí)行此程序,以便于觀察程序的運行情況,了解程序運行出錯的各類提示信息。在執(zhí)行xSegmenter.exe過程中,系統(tǒng)會自動創(chuàng)建以下三個臨時文件夾:

TEMP文件夾:用于存放訓練過程中所產(chǎn)生的一些臨時文件,不用時可以刪除。程序會根據(jù)這些臨時文件來自動確定其相應的運行步驟,跳過已經(jīng)執(zhí)行完的步驟,以提高運行效率。如果全部刪除了該文件夾中的內容,下次再運行xSegmenter.exe程序時,便會從第一步開始重新運行。所以在完成切分與標注任務之前,最好不要刪改該文件夾中的任何內容。但在開始一個新的音段切分任務的時候,應注意檢查是否存在TEMP文件夾,如果存在應事先予以刪除。

HMM文件夾:用于存放最終生成的單音素聲學模型文件及其相關的數(shù)據(jù)資源文件,包括音素列表文件和發(fā)音詞典文件,不用時可以刪除。如果HMM文件夾中已經(jīng)存放了這三個文件,程序在運行時則會自動跳過聲學模型訓練的中間過程,直接調用這幾個文件數(shù)據(jù)進行音段強制對齊與標注操作。所以在訓練得到這幾個聲學模型文件之后,可將其保存起來,以便于后期直接調用,用于同類語料的切分與標注操作。

DATA文件夾:用于拷貝存放用戶的聲音文件及其相關的頻譜參數(shù)文件,不用時可以完全刪除,刪除操作不會影響到用戶的原始數(shù)據(jù)。該文件夾中存放的頻譜參數(shù)文件,擴展名為*.plp或*.mfc,聲音文件的擴展名為*.raw。用戶在對同一語音語料庫重新進行操作時,如出錯后重新運行,則無須事先刪除DATA文件夾內的數(shù)據(jù)文件,以免再次運行時又耗費時間去重新生成raw格式的聲音文件及其相應的頻譜參數(shù)文件。

一般而言,在程序執(zhí)行過程之中,僅需要用戶干預的地方是檢查segment*.dict文件中的詞條內容,該文件由程序根據(jù)用戶提供的發(fā)音文本和發(fā)音詞典自動生成。如果程序發(fā)現(xiàn)未登錄詞,則會在某個階段暫停程序的執(zhí)行過程,提醒用戶去檢查和修改segment*.dict文件中被標記為“unk”的發(fā)音條目,并等待用戶的按鍵操作。如果用戶給定的發(fā)音詞典包含了全部發(fā)音文本中的所有詞條及其讀音形式,則通常不會出現(xiàn)此提示信息。用戶修改完segment*.dict文件之后,按“y”鍵即可繼續(xù)運行程序。當程序運行全部結束之后,用戶在各個聲音文件的原始路徑下即可看到相應的語音標注文件,其擴展名為*.TextGrid。

據(jù)測試,如果用戶提供的三類數(shù)據(jù)文件均無內容和格式上的問題,程序在執(zhí)行過程中一般就不會出現(xiàn)什么問題。容易導致程序出錯的原因主要有兩個方面:一是發(fā)音詞典文件,例如出現(xiàn)了未登錄詞,或者出現(xiàn)了詞條格式問題、編碼問題等。二是聲音文件太少或者聲音質量太差,導致某個或某些音素的聲學模型建立不起來。也就是說,如果程序運行出錯了,可以先從這兩個方面去找原因,并核查相應數(shù)據(jù)。

主站蜘蛛池模板: 贺州市| 石狮市| 盐池县| 西平县| 盐池县| 枣阳市| 梅河口市| 新河县| 西林县| 富蕴县| 盐亭县| 苏州市| 巴塘县| 吉林市| 江山市| 重庆市| 手游| 米林县| 观塘区| 古浪县| 壶关县| 遂昌县| 清远市| 浮山县| 涟源市| 彰武县| 堆龙德庆县| 潼南县| 莆田市| 肥东县| 信阳市| 梅州市| 简阳市| 甘孜县| 岚皋县| 左贡县| 华宁县| 长武县| 阳山县| 丰城市| 翁源县|