鉴别式语言模型於语音辨識结果重新排序之研究.PDF

鉴别式语言模型於语音辨識结果重新排序之研究.PDF

  1. 1、本文档共20页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
鑑別式語言模型於語音辨識結果重新排序之研究 Exploiting Discriminative Language Models for Reranking Speech Recognition Hypotheses 劉家妏 Chia-Wen Liu 國立臺灣師範大學資訊工程學系 Department of Computer Science and Information Engineering National Taiwan Normal University 697470171@.tw 林士翔 Shih-Hsiang Lin 國立臺灣師範大學資訊工程學系 Department of Computer Science and Information Engineering National Taiwan Normal University 896470017@.tw 陳柏琳 Berlin Chen 國立臺灣師範大學資訊工程學系 Department of Computer Science and Information Engineering National Taiwan Normal University berlin@.tw 摘要 任何語言都有許多潛在的規律性,若能擷取與分析這些特性,電腦就能進一步被 用來理解人類語句或自動產生能表達某種語意的語句。統計式語言模型 (Statistical Language Models)透過機率模型的建立來描述語言生成的規律性,其模 型參數可由大量的文字語料庫所訓練而成。語音辨識常使用 N 連(N-gram)語言模 型,它以估測每一個詞在其先前緊鄰 N-1 個詞已知的情況下出現的條件機率,來 判斷語音辨識結果的可能性;但因其訓練並不是以降低語音錯誤率為目標,導致 在語音辨識效能表現上有所侷限。有別於傳統 N 連語言模型,近年來有許多直 接以最小化語音辨識錯誤率為目標的鑑別式語言模型(Discriminative Language Model)被提出。本論文介紹了多種基於不同訓練精神的鑑別式語言模型,並比較 與討論它們在中文大詞彙連續語音辨識上的表現。另外,我們提出語句相關之鑑 別式語言模型,改進了傳統鑑別式語言模型在測試過程中所有測試語句皆使用相 同語言模型特徵權重參數向量的缺點,讓不同測試語句擁有各自的組合係數來線 性結合不同訓練語料所訓練而得的語言模型特徵權重參數向量,以期新的權重參 數向量能更加符合測試語句的特性。實驗結果顯示本論文所提出的語句相關之鑑 別式語言模型,相較於僅使用三連語言模型、或使用傳統鑑別式語言模型的基礎 大詞彙連續語音辨識系統,能有相當程度的語音辨識率提升。 關鍵詞:語音辨識、語言模型、鑑別式語言模型、重新排序。 一、緒論 語言是人類最自然且直接的溝通方式,而如何讓電腦達到如人類般具備「聽、說、 讀、寫」能力就是語音處理領域長期以來努力的目標。為了讓電腦擁有此能力, 首先要做到的便是如何讓它能夠「聽」懂使用者的語音輸入;而將語音訊號轉換 成文字的過程,須透過自動語音辨識(Automatic Speech Recognition, ASR)來達成。 為此,我們首先須將聲音數位訊號經由特徵擷取(Feature Extraction)而產生出能代 表語音的聲學特性(Acoustic Characteristics)且易於電腦處理的聲學特徵向量;接 著,將聲學特徵向量透過機率模型建立起其對應的聲學模型(Acoustic Model) ,串 連起聲音與文字間的對應關係;最後,再由使用大量文

文档评论(0)

***** + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档