芒果视频

網(wang)站分類
登錄 |    

聲紋識別是什么 帶你走進聽聲辨人的科技

本文章由注冊用戶 知識君 上傳提供 評論 發布 反饋 0
摘要:除了指紋識別、人臉識別和虹膜識別,聲紋識別也屬于生物識別的一種,被廣泛應用于智能產品、金融和刑偵等領域。什么是聲紋識別?聲紋識別即運用聲音來識別人的身份,聲紋識別的原理在于把聲信號轉換成電信號在進行對比識別。那么聲紋識別的優缺點是什么?其過程又是什么呢?下面一起來看看詳細介紹。

聲紋識別原理

聲(sheng)(sheng)紋是用(yong)電聲(sheng)(sheng)學儀器顯(xian)示的攜(xie)帶(dai)言語(yu)信息的聲(sheng)(sheng)波頻譜(pu)。人(ren)(ren)類(lei)語(yu)言的產生(sheng)是人(ren)(ren)體語(yu)言中樞(shu)與發音器官(guan)之間一個復雜的生(sheng)理物理過程,人(ren)(ren)在講話(hua)時(shi)使(shi)用(yong)的發聲(sheng)(sheng)器官(guan)--舌、牙齒、喉頭、肺(fei)、鼻腔在尺寸和形態方面每(mei)個人(ren)(ren)的差(cha)異很大,所以任何兩個人(ren)(ren)的聲(sheng)(sheng)紋圖(tu)譜(pu)都有差(cha)異。這也使(shi)得聲(sheng)(sheng)紋識別也可以稱為(wei)身份認證的一種方式(shi)。

該圖片由注冊用戶"知識君"提供,版權聲明反饋

聲紋識別優缺點

1、聲紋識別(bie)的優勢在于:

(1)聲紋提(ti)取方(fang)便,可在不知不覺中完成(cheng),因此使用者(zhe)的接受程度也高;

(2)獲取語音(yin)的(de)識(shi)別成本低(di)廉,使用(yong)簡(jian)單,一個(ge)麥克風即可(ke),在使用(yong)通訊設備時更無(wu)需額(e)外的(de)錄音(yin)設備;

(3)適合遠程身份確認,只需要一個麥克風或電話、手機就可以通過網路(通訊(xun)網絡(luo)或互聯網絡(luo))實現遠程登錄;

(4)聲紋辨認和確認的算法復雜(za)度低(di);

(5)配合(he)一些其他措施,如通過語音識(shi)別進行內容鑒別等,可(ke)以提(ti)高準(zhun)確率。這些優勢使得聲(sheng)紋識(shi)別的(de)應用越來越受到系統開發者(zhe)和用戶青睞。

2、聲(sheng)紋識別的(de)缺(que)點(dian):

當然,聲紋(wen)識(shi)別(bie)的(de)(de)應用有一些缺點,比(bi)如(ru)同(tong)一個人(ren)的(de)(de)聲音(yin)具有易變性,易受身體狀況、年(nian)齡、情(qing)緒(xu)等(deng)的(de)(de)影(ying)響;比(bi)如(ru)不同(tong)的(de)(de)麥(mai)克風和信(xin)道對(dui)識(shi)別(bie)性能有影(ying)響;比(bi)如(ru)環境(jing)噪(zao)音(yin)對(dui)識(shi)別(bie)有干(gan)擾;又比(bi)如(ru)混(hun)合說話人(ren)的(de)(de)情(qing)形下(xia)人(ren)的(de)(de)聲紋(wen)特征不易提取等(deng)等(deng)。

聲紋識別的過程

聲(sheng)紋識別的過程包括:語音信(xin)號處(chu)理、聲(sheng)紋特征提取、聲(sheng)紋建(jian)模、聲(sheng)紋比對、判別決策等。

聲紋識別匹配模式

聲(sheng)(sheng)紋識別技術的關鍵在(zai)于(yu)對各種聲(sheng)(sheng)學(xue)特(te)征參數進行處(chu)理,并確定模式匹(pi)配(pei)方(fang)(fang)法,主要(yao)的模式匹(pi)配(pei)方(fang)(fang)法包括:

1、模板(ban)匹配(pei)方法:利用(yong)動態時(shi)間彎折(DTW)以對準訓練和測試(shi)特征序列,主要用(yong)于固(gu)定(ding)詞組的應用(yong)(通常為文本(ben)相關任(ren)務);

2、最(zui)近鄰(lin)方法:訓練時(shi)保留所有特征矢量,識(shi)(shi)別時(shi)對(dui)每個矢量都(dou)找(zhao)到訓練矢量中最(zui)近的K個,據此進行識(shi)(shi)別,通常模型存儲和相似(si)計(ji)算的量都(dou)很大;

3、神經網(wang)絡(luo)方法:有很(hen)多(duo)種形式,如多(duo)層感知、徑向基函數(shu)(RBF)等,可以顯(xian)式訓練(lian)以區分說話人和(he)其背(bei)景說話人,其訓練(lian)量(liang)很(hen)大,且模型(xing)的可推(tui)廣(guang)性不(bu)好;

5、VQ聚類方法(fa)(如(ru)LBG):效(xiao)果(guo)比(bi)較好(hao),算法(fa)復(fu)雜度(du)也(ye)不(bu)高,和HMM方法(fa)配合起來更(geng)可以收到更(geng)好(hao)的(de)效(xiao)果(guo);

6、多項式分類器方法:有較高的精(jing)度,但模型存儲和計算量都(dou)比較大;

此外(wai)還有(you)概率(lv)統計方(fang)法、動態(tai)時(shi)間規整方(fang)法、矢量量化方(fang)法等等。

聲紋識別技術的難點

目前(qian),聲紋(wen)識別技術的市場應用并不(bu)廣泛,,但(dan)并非這項技術本身(shen)不(bu)成(cheng)熟(shu),而是由于實(shi)際商業應用場景的復雜性(xing),很可(ke)能導致(zhi)身(shen)份識別產生(sheng)較大(da)誤差。

首先,說話人的語(yu)音(yin)聲學特征不(bu)可避免(mian)地(di)具有發展性和變異性,既便是同一個人,即便采集(ji)到的兩段語(yu)音(yin)內容都是相同的,但是在不(bu)同的時(shi)期或(huo)特殊的情境下,由(you)于(yu)情緒、語(yu)速、疲勞程(cheng)度等原因(yin),聲紋特征也(ye)不(bu)盡一致(zhi);

其次(ci),聲(sheng)紋特征(zheng)提取是在現實環境中進行的,如何降噪(zao)(zao)以及去混(hun)響(xiang)依然是聲(sheng)紋識(shi)別的一大難題。在外部環境中,各種噪(zao)(zao)音都會(hui)通(tong)過錄音設(she)備采集進來,這些噪(zao)(zao)音會(hui)在一定(ding)程(cheng)度(du)上混(hun)淆或者(zhe)淹沒說(shuo)(shuo)話人信(xin)息,使(shi)得聲(sheng)紋系統(tong)無法獲取準確的說(shuo)(shuo)話人聲(sheng)紋特征(zheng)。因此,應用聲(sheng)紋識(shi)別技術(shu)的產品大多適合在相(xiang)對安靜的場合使(shi)用。

網站提醒和聲明
本(ben)站(zhan)(zhan)為(wei)注冊(ce)(ce)用戶提(ti)供(gong)(gong)信息存儲(chu)空(kong)間服務,非(fei)“MAIGOO編輯上(shang)傳提(ti)供(gong)(gong)”的(de)文章/文字均是(shi)注冊(ce)(ce)用戶自主發(fa)布上(shang)傳,不(bu)代(dai)表(biao)本(ben)站(zhan)(zhan)觀點,更不(bu)表(biao)示本(ben)站(zhan)(zhan)支持購買(mai)和交易(yi),本(ben)站(zhan)(zhan)對網頁中內容的(de)合法性(xing)、準(zhun)確性(xing)、真實性(xing)、適用性(xing)、安全(quan)性(xing)等概不(bu)負責(ze)。版權(quan)歸(gui)原(yuan)作者所有,如有侵權(quan)、虛假信息、錯誤(wu)信息或任何問題(ti),請及時聯(lian)系(xi)我們,我們將(jiang)在第一時間刪除或更正。 申請刪除>> 糾錯>> 投訴侵權>>
提交說明: 快速提交發布>> 查看提交幫助>> 注冊登錄>>
發表評論
您還未登錄,依《網絡安全法》相關要求,請您登錄賬戶后再提交發布信息。點擊登錄>>如您還未注冊,可,感謝您的理解及支持!
最新評論
暫無評論
頁面相關分類
熱門模塊
已有1642927個品牌入駐 更新517447個招商信息 已發布1569922個加盟需求 已有1284307條品牌點贊