語音識別芯片的原理
嵌入式語(yu)音(yin)識(shi)別系(xi)統(tong)都采用了模式匹配(pei)的原理(li)。錄入的語(yu)音(yin)信(xin)號(hao)(hao)首先經(jing)過預處理(li),包括語(yu)音(yin)信(xin)號(hao)(hao)的采樣(yang)、反(fan)混疊(die)濾波(bo)、語(yu)音(yin)增強(qiang),接下(xia)來是(shi)特征(zheng)提取,用以從語(yu)音(yin)信(xin)號(hao)(hao)波(bo)形中提取一組(zu)或(huo)幾組(zu)能夠描述語(yu)音(yin)信(xin)號(hao)(hao)特征(zheng)的參數(shu)。特征(zheng)提取之后的數(shu)據一般分為兩個步驟,第一步是(shi)系(xi)統(tong)“學習”或“訓練”階段,這一階段的任務是構建參考模式庫,詞表中每個詞對應一個參考模式,它由這個詞重復發音多遍,再經特征提取和某種訓練中得到。第二是“識別”或“測試”階段,按照一定的準則求取待測語音特征參數和語音信息與模式庫中相應模板之間的失真測度,最匹配的就是識別結果。
語音識別芯片分類
按照使用者的限制而言,語音識別芯片可以分為特(te)定(ding)人語(yu)音識(shi)別芯片(pian)(pian)和非特(te)定(ding)人語(yu)音識(shi)別芯片(pian)(pian)。
特定人語音識別
特定(ding)人語(yu)(yu)音識別(bie)芯片是針(zhen)對指定(ding)人的(de)(de)語(yu)(yu)音識別(bie),其他人的(de)(de)話(hua)不識別(bie),須(xu)先把使(shi)用(yong)者的(de)(de)語(yu)(yu)音參(can)考樣本存入(ru)當成比對的(de)(de)資料庫(ku),即特定(ding)人語(yu)(yu)音識別(bie)在使(shi)用(yong)前必須(xu)要進行語(yu)(yu)音訓練,一般(ban)按照機器提示訓練2遍語音詞條即可使用。
非特定人語音識別
非特定(ding)(ding)人(ren)語音(yin)識(shi)別是不用(yong)針(zhen)對(dui)指定(ding)(ding)的人(ren)的識(shi)別技術(shu),不分年齡、性別,只要(yao)說相同語言就可以,應用(yong)模式是在(zai)產品定(ding)(ding)型(xing)前按(an)照確定(ding)(ding)的十幾個語音(yin)交互詞條,采集200人左右的聲音樣本,經過PC算(suan)法處理得到(dao)交互(hu)詞條的語音(yin)模型和(he)特征(zheng)數據庫,然后燒錄到(dao)芯(xin)片上(shang)。應用這(zhe)種芯(xin)片的機器(智能娃(wa)娃(wa)、電子寵(chong)物、兒童電腦)就具有交互(hu)功能了。
非(fei)特定人語音(yin)識(shi)別應用有(you)的是(shi)基(ji)于音(yin)素的算法,這種模式(shi)下(xia)不(bu)需(xu)要(yao)采集很多人的聲音(yin)樣(yang)本(ben)就(jiu)可以做交互識(shi)別,但(dan)是(shi)缺(que)點(dian)是(shi)識(shi)別率不(bu)高,識(shi)別性能不(bu)穩定。
按(an)照(zhao)說話(hua)方式的(de)連(lian)續性,語(yu)音識(shi)別芯片又可分為非連(lian)續語(yu)音識(shi)別和連(lian)續語(yu)音識(shi)別。
非連續語音識別
對于非連(lian)續語音(yin)來說,識別所說的(de)每一(yi)個(ge)字(zi)(zi)必(bi)須分開(kai)辨認,要求說完每個(ge)字(zi)(zi)后都要停頓。
連續語音識別
連續語音識別(bie)(bie)可(ke)以一般自然流利的(de)說(shuo)話方式(shi)來進行人性化的(de)語音識別(bie)(bie),但由于關系到相連音的(de)問題,很難達到好的(de)辨認(ren)效(xiao)果。
申明:以上內容源于程序系統索引或網民分享提供,僅供您參考使用,不代表本網站的研究觀點,請注意甄別內容來源的真實性和權威性。