語音識別芯片的原理
嵌(qian)入式語(yu)(yu)音(yin)識別(bie)系統都采用(yong)了(le)模(mo)式匹配(pei)的原理。錄入的語(yu)(yu)音(yin)信號首先經過預處(chu)理,包(bao)括語(yu)(yu)音(yin)信號的采樣(yang)、反混疊濾波、語(yu)(yu)音(yin)增強,接(jie)下來是特征(zheng)(zheng)提取,用(yong)以從(cong)語(yu)(yu)音(yin)信號波形(xing)中提取一組或幾(ji)組能夠描述語(yu)(yu)音(yin)信號特征(zheng)(zheng)的參數(shu)。特征(zheng)(zheng)提取之后的數(shu)據(ju)一般分(fen)為(wei)兩(liang)個步(bu)驟,第一步(bu)是系統“學習”或“訓練”階段,這一階段的任務是構建參考模式庫,詞表中每個詞對應一個參考模式,它由這個詞重復發音多遍,再經特征提取和某種訓練中得到。第二是“識別”或“測試”階段,按照一定的準則求取待測語音特征參數和語音信息與模式庫中相應模板之間的失真測度,最匹配的就是識別結果。
語音識別芯片分類
按照使用者的限制而言,語音識別芯片可以分為(wei)特定人語(yu)音(yin)(yin)識別芯片(pian)和非特定人語(yu)音(yin)(yin)識別芯片(pian)。
特定人語音識別
特(te)(te)定(ding)人語(yu)音識別(bie)芯片(pian)是針對(dui)指定(ding)人的語(yu)音識別(bie),其(qi)他人的話(hua)不識別(bie),須先把使(shi)用者的語(yu)音參考樣本存入當成比(bi)對(dui)的資料(liao)庫,即特(te)(te)定(ding)人語(yu)音識別(bie)在使(shi)用前必須要進行語(yu)音訓(xun)練,一般按照機器提示訓(xun)練2遍(bian)語音詞條(tiao)即可使用。
非特定人語音識別
非(fei)特定人語音識別是(shi)不用(yong)針對指定的人的識別技術,不分年齡、性別,只要說相同語言(yan)就可以,應用(yong)模式是(shi)在產品定型前按照確定的十(shi)幾(ji)個語音交互詞條,采集200人左右的聲音樣本(ben),經(jing)過PC算法處(chu)理(li)得到交(jiao)互詞(ci)條的語音(yin)模型和特(te)征(zheng)數據庫,然后燒錄(lu)到芯片上。應用這種芯片的機器(智能娃(wa)娃(wa)、電(dian)子寵物、兒童電(dian)腦(nao))就具有交(jiao)互功能了。
非特定(ding)人語音識(shi)別(bie)(bie)(bie)應用有的(de)是基(ji)于音素的(de)算法(fa),這種(zhong)模式下不(bu)需要(yao)采(cai)集很多人的(de)聲音樣本就(jiu)可以(yi)做交互識(shi)別(bie)(bie)(bie),但是缺點是識(shi)別(bie)(bie)(bie)率不(bu)高,識(shi)別(bie)(bie)(bie)性能不(bu)穩定(ding)。
按照說(shuo)話(hua)方式的連續(xu)性,語(yu)(yu)音識別(bie)(bie)芯片又可分為非連續(xu)語(yu)(yu)音識別(bie)(bie)和(he)連續(xu)語(yu)(yu)音識別(bie)(bie)。
非連續語音識別
對于非連續語音(yin)來說(shuo)(shuo),識(shi)別所說(shuo)(shuo)的每一(yi)個(ge)(ge)字必須分開辨認,要求說(shuo)(shuo)完每個(ge)(ge)字后都要停頓(dun)。
連續語音識別
連續語音(yin)(yin)識別(bie)可以一般自然流利的說話方式(shi)來進(jin)行人性化的語音(yin)(yin)識別(bie),但由于關系到相(xiang)連音(yin)(yin)的問題,很難達到好的辨認效果。
申明:以上內容源于程序系統索引或網民分享提供,僅供您參考使用,不代表本網站的研究觀點,請注意甄別內容來源的真實性和權威性。