芒果视频

網站分類
登錄 |    

聲紋識別是什么 帶你走進聽聲辨人的科技

本文章由注冊用戶 知識君 上傳提供 評論 發布 反饋 0
摘要:除了指紋識別、人臉識別和虹膜識別,聲紋識別也屬于生物識別的一種,被廣泛應用于智能產品、金融和刑偵等領域。什么是聲紋識別?聲紋識別即運用聲音來識別人的身份,聲紋識別的原理在于把聲信號轉換成電信號在進行對比識別。那么聲紋識別的優缺點是什么?其過程又是什么呢?下面一起來看看詳細介紹。

聲紋識別原理

聲(sheng)紋(wen)是(shi)用電聲(sheng)學儀(yi)器顯示的(de)(de)(de)攜(xie)帶言(yan)(yan)語信(xin)息的(de)(de)(de)聲(sheng)波(bo)頻(pin)譜(pu)。人(ren)(ren)類語言(yan)(yan)的(de)(de)(de)產生是(shi)人(ren)(ren)體語言(yan)(yan)中樞與(yu)發音(yin)器官之間一(yi)個復雜的(de)(de)(de)生理物(wu)理過程(cheng),人(ren)(ren)在講話(hua)時使(shi)用的(de)(de)(de)發聲(sheng)器官--舌、牙齒、喉頭、肺(fei)、鼻腔在尺寸和形(xing)態(tai)方(fang)面(mian)每個人(ren)(ren)的(de)(de)(de)差異(yi)很大(da),所以(yi)任何兩個人(ren)(ren)的(de)(de)(de)聲(sheng)紋(wen)圖譜(pu)都有差異(yi)。這也(ye)使(shi)得聲(sheng)紋(wen)識別也(ye)可以(yi)稱為身(shen)份認證的(de)(de)(de)一(yi)種方(fang)式。

該圖片由注冊用戶"知識君"提供,版權聲明反饋

聲紋識別優缺點

1、聲紋識別(bie)的優勢在于:

(1)聲紋提取方便,可在不(bu)知(zhi)不(bu)覺中完成,因此使用者的(de)接受(shou)程度(du)也(ye)高;

(2)獲取語音(yin)(yin)的(de)識別成本低廉,使用(yong)簡單,一個麥克風即(ji)可,在使用(yong)通訊設備(bei)時更無需額外(wai)的(de)錄音(yin)(yin)設備(bei);

(3)適合遠程身份確認,只需要一個麥克風或電話、手機就可以通過(guo)網(wang)路(通訊網(wang)絡或(huo)互聯網(wang)絡)實現遠程(cheng)登錄(lu);

(4)聲紋辨(bian)認和確認的算(suan)法復雜度(du)低(di);

(5)配合一些其他措施,如通過語音(yin)識(shi)別進(jin)行(xing)內(nei)容鑒別等,可以提高(gao)準(zhun)確(que)率。這些優勢使得聲紋識(shi)別的(de)應用越來越受(shou)到系統開發者和用戶青睞。

2、聲紋(wen)識別的(de)缺點:

當然,聲(sheng)紋識別的(de)應用有一些缺點,比(bi)如(ru)(ru)同一個人的(de)聲(sheng)音具(ju)有易(yi)變性(xing),易(yi)受身體狀況、年齡(ling)、情(qing)緒等的(de)影響(xiang);比(bi)如(ru)(ru)不同的(de)麥(mai)克風和信(xin)道對識別性(xing)能有影響(xiang);比(bi)如(ru)(ru)環境噪音對識別有干擾;又比(bi)如(ru)(ru)混合說話人的(de)情(qing)形下(xia)人的(de)聲(sheng)紋特征(zheng)不易(yi)提取等等。

聲紋識別的過程

聲紋識別的過程(cheng)包(bao)括:語音信號處理、聲紋特征提取、聲紋建模、聲紋比對、判別決策等。

聲紋識別匹配模式

聲紋識(shi)別(bie)技術的關鍵在于對各種聲學特征參數進(jin)行處理(li),并確定(ding)模式(shi)匹(pi)配方法,主要的模式(shi)匹(pi)配方法包括:

1、模板匹配方法:利用動態時間(jian)彎折(zhe)(DTW)以對(dui)準訓練和(he)測試(shi)特征序列,主要用于固(gu)定詞組的(de)應(ying)用(通常為文本相(xiang)關(guan)任(ren)務);

2、最近鄰方(fang)法:訓(xun)練時(shi)保留所有特(te)征(zheng)矢(shi)量(liang),識別(bie)(bie)時(shi)對每個矢(shi)量(liang)都找到訓(xun)練矢(shi)量(liang)中最近的K個,據此進行識別(bie)(bie),通常模(mo)型存儲和相似計(ji)算的量(liang)都很大;

3、神經網絡方法:有很(hen)多種形式,如多層感知、徑向基函數(RBF)等,可(ke)以顯(xian)式訓練(lian)以區分說話人(ren)和其(qi)(qi)背景說話人(ren),其(qi)(qi)訓練(lian)量(liang)很(hen)大(da),且模(mo)型的可(ke)推廣性不好;

5、VQ聚(ju)類方(fang)法(如LBG):效果(guo)比較(jiao)好,算法復雜度(du)也不(bu)高,和HMM方(fang)法配合(he)起來更可以收到更好的(de)效果(guo);

6、多項式分(fen)類器方法:有(you)較高的精度(du),但模型存儲和計算(suan)量都比較大;

此外還(huan)有概率(lv)統計方法(fa)(fa)、動態(tai)時間規整(zheng)方法(fa)(fa)、矢量(liang)量(liang)化方法(fa)(fa)等(deng)等(deng)。

聲紋識別技術的難點

目前,聲紋識別技(ji)術(shu)的市場應(ying)用并不(bu)廣泛(fan),,但并非這項(xiang)技(ji)術(shu)本身(shen)不(bu)成熟,而是由于實(shi)際商業應(ying)用場景的復雜性(xing),很可能導致身(shen)份識別產生較大誤差。

首先,說話人的(de)語(yu)(yu)音聲學特征不可避免地具有發(fa)展性和變(bian)異(yi)性,既(ji)便是(shi)(shi)同(tong)一個(ge)人,即便采集到的(de)兩段語(yu)(yu)音內容都是(shi)(shi)相同(tong)的(de),但是(shi)(shi)在不同(tong)的(de)時期或特殊的(de)情(qing)境下,由(you)于情(qing)緒(xu)、語(yu)(yu)速、疲勞(lao)程度等原(yuan)因,聲紋特征也不盡一致;

其次,聲紋(wen)特(te)征(zheng)提取是(shi)(shi)在(zai)現實環境(jing)(jing)中(zhong)進(jin)行(xing)的(de),如(ru)何降噪(zao)(zao)以及(ji)去混響(xiang)依(yi)然(ran)是(shi)(shi)聲紋(wen)識別的(de)一大難(nan)題。在(zai)外部環境(jing)(jing)中(zhong),各(ge)種噪(zao)(zao)音(yin)都會通過錄音(yin)設備(bei)采(cai)集進(jin)來,這些噪(zao)(zao)音(yin)會在(zai)一定程度上混淆或者淹沒說話人信(xin)息,使得聲紋(wen)系統(tong)無法獲取準確(que)的(de)說話人聲紋(wen)特(te)征(zheng)。因此,應用聲紋(wen)識別技術的(de)產(chan)品(pin)大多適合(he)在(zai)相(xiang)對安(an)靜的(de)場合(he)使用。

網站提醒和聲明
本(ben)站(zhan)(zhan)為(wei)注冊(ce)用(yong)戶提供信息存儲空間服務,非“MAIGOO編輯上傳提供”的文章/文字(zi)均是(shi)注冊(ce)用(yong)戶自主(zhu)發(fa)布上傳,不(bu)(bu)代表本(ben)站(zhan)(zhan)觀(guan)點,更(geng)不(bu)(bu)表示本(ben)站(zhan)(zhan)支持購買和(he)交(jiao)易,本(ben)站(zhan)(zhan)對網頁中(zhong)內容的合法性(xing)、準(zhun)確性(xing)、真實性(xing)、適用(yong)性(xing)、安(an)全(quan)性(xing)等概不(bu)(bu)負(fu)責(ze)。版權歸(gui)原作者(zhe)所有,如有侵權、虛假信息、錯誤信息或任(ren)何問題,請(qing)及時(shi)聯系我們(men),我們(men)將在(zai)第一時(shi)間刪除或更(geng)正。 申請刪除>> 糾錯>> 投訴侵權>>
提交說明: 快速提交發布>> 查看提交幫助>> 注冊登錄>>
發表評論
您還未登錄,依《網絡安全法》相關要求,請您登錄賬戶后再提交發布信息。點擊登錄>>如您還未注冊,可,感謝您的理解及支持!
最新評論
暫無評論
頁面相關分類
熱門模塊
已有1642927個品牌入駐 更新517447個招商信息 已發布1569922個加盟需求 已有1284307條品牌點贊