米家

美居

華為

小度

京魚座

螢石

歐瑞博

BroadLink

控客

聲紋識別是什么帶你走進聽聲辨人的科技

本文章由注冊用戶知識君上傳提供評論發布反饋 0

摘要：除了指紋識別、人臉識別和虹膜識別，聲紋識別也屬于生物識別的一種，被廣泛應用于智能產品、金融和刑偵等領域。什么是聲紋識別？聲紋識別即運用聲音來識別人的身份，聲紋識別的原理在于把聲信號轉換成電信號在進行對比識別。那么聲紋識別的優缺點是什么？其過程又是什么呢？下面一起來看看詳細介紹。

聲紋識別原理

聲(sheng)紋(wen)是(shi)用電聲(sheng)學儀(yi)器顯示的(de)(de)(de)攜(xie)帶言(yan)(yan)語信(xin)息的(de)(de)(de)聲(sheng)波(bo)頻(pin)譜(pu)。人(ren)(ren)類語言(yan)(yan)的(de)(de)(de)產生是(shi)人(ren)(ren)體語言(yan)(yan)中樞與(yu)發音(yin)器官之間一(yi)個復雜的(de)(de)(de)生理物(wu)理過程(cheng)，人(ren)(ren)在講話(hua)時使(shi)用的(de)(de)(de)發聲(sheng)器官--舌、牙齒、喉頭、肺(fei)、鼻腔在尺寸和形(xing)態(tai)方(fang)面(mian)每個人(ren)(ren)的(de)(de)(de)差異(yi)很大(da)，所以(yi)任何兩個人(ren)(ren)的(de)(de)(de)聲(sheng)紋(wen)圖譜(pu)都有差異(yi)。這也(ye)使(shi)得聲(sheng)紋(wen)識別也(ye)可以(yi)稱為身(shen)份認證的(de)(de)(de)一(yi)種方(fang)式。

聲紋識別優缺點

1、聲紋識別(bie)的優勢在于：

（1）聲紋提取方便，可在不(bu)知(zhi)不(bu)覺中完成，因此使用者的(de)接受(shou)程度(du)也(ye)高；

（2）獲取語音(yin)(yin)的(de)識別成本低廉，使用(yong)簡單，一個麥克風即(ji)可，在使用(yong)通訊設備(bei)時更無需額外(wai)的(de)錄音(yin)(yin)設備(bei)；

（3）適合遠程身份確認，只需要一個麥克風或電話、手機就可以通過(guo)網(wang)路（通訊網(wang)絡或(huo)互聯網(wang)絡）實現遠程(cheng)登錄(lu)；

（4）聲紋辨(bian)認和確認的算(suan)法復雜度(du)低(di)；

（5）配合一些其他措施，如通過語音(yin)識(shi)別進(jin)行(xing)內(nei)容鑒別等，可以提高(gao)準(zhun)確(que)率。這些優勢使得聲紋識(shi)別的(de)應用越來越受(shou)到系統開發者和用戶青睞。

2、聲紋(wen)識別的(de)缺點：

當然，聲(sheng)紋識別的(de)應用有一些缺點，比(bi)如(ru)(ru)同一個人的(de)聲(sheng)音具(ju)有易(yi)變性(xing)，易(yi)受身體狀況、年齡(ling)、情(qing)緒等的(de)影響(xiang)；比(bi)如(ru)(ru)不同的(de)麥(mai)克風和信(xin)道對識別性(xing)能有影響(xiang)；比(bi)如(ru)(ru)環境噪音對識別有干擾；又比(bi)如(ru)(ru)混合說話人的(de)情(qing)形下(xia)人的(de)聲(sheng)紋特征(zheng)不易(yi)提取等等。

聲紋識別的過程

聲紋識別的過程(cheng)包(bao)括：語音信號處理、聲紋特征提取、聲紋建模、聲紋比對、判別決策等。

聲紋識別匹配模式

聲紋識(shi)別(bie)技術的關鍵在于對各種聲學特征參數進(jin)行處理(li)，并確定(ding)模式(shi)匹(pi)配方法，主要的模式(shi)匹(pi)配方法包括：

1、模板匹配方法：利用動態時間(jian)彎折(zhe)（DTW）以對(dui)準訓練和(he)測試(shi)特征序列，主要用于固(gu)定詞組的(de)應(ying)用（通常為文本相(xiang)關(guan)任(ren)務）；

2、最近鄰方(fang)法：訓(xun)練時(shi)保留所有特(te)征(zheng)矢(shi)量(liang)，識別(bie)(bie)時(shi)對每個矢(shi)量(liang)都找到訓(xun)練矢(shi)量(liang)中最近的K個，據此進行識別(bie)(bie)，通常模(mo)型存儲和相似計(ji)算的量(liang)都很大；

3、神經網絡方法：有很(hen)多種形式，如多層感知、徑向基函數（RBF）等，可(ke)以顯(xian)式訓練(lian)以區分說話人(ren)和其(qi)(qi)背景說話人(ren)，其(qi)(qi)訓練(lian)量(liang)很(hen)大(da)，且模(mo)型的可(ke)推廣性不好；

5、VQ聚(ju)類方(fang)法（如LBG）：效果(guo)比較(jiao)好，算法復雜度(du)也不(bu)高，和HMM方(fang)法配合(he)起來更可以收到更好的(de)效果(guo)；

6、多項式分(fen)類器方法：有(you)較高的精度(du)，但模型存儲和計算(suan)量都比較大；

此外還(huan)有概率(lv)統計方法(fa)(fa)、動態(tai)時間規整(zheng)方法(fa)(fa)、矢量(liang)量(liang)化方法(fa)(fa)等(deng)等(deng)。

聲紋識別技術的難點

目前，聲紋識別技(ji)術(shu)的市場應(ying)用并不(bu)廣泛(fan),，但并非這項(xiang)技(ji)術(shu)本身(shen)不(bu)成熟，而是由于實(shi)際商業應(ying)用場景的復雜性(xing)，很可能導致身(shen)份識別產生較大誤差。

首先，說話人的(de)語(yu)(yu)音聲學特征不可避免地具有發(fa)展性和變(bian)異(yi)性，既(ji)便是(shi)(shi)同(tong)一個(ge)人，即便采集到的(de)兩段語(yu)(yu)音內容都是(shi)(shi)相同(tong)的(de)，但是(shi)(shi)在不同(tong)的(de)時期或特殊的(de)情(qing)境下，由(you)于情(qing)緒(xu)、語(yu)(yu)速、疲勞(lao)程度等原(yuan)因，聲紋特征也不盡一致；

其次，聲紋(wen)特(te)征(zheng)提取是(shi)(shi)在(zai)現實環境(jing)(jing)中(zhong)進(jin)行(xing)的(de)，如(ru)何降噪(zao)(zao)以及(ji)去混響(xiang)依(yi)然(ran)是(shi)(shi)聲紋(wen)識別的(de)一大難(nan)題。在(zai)外部環境(jing)(jing)中(zhong)，各(ge)種噪(zao)(zao)音(yin)都會通過錄音(yin)設備(bei)采(cai)集進(jin)來，這些噪(zao)(zao)音(yin)會在(zai)一定程度上混淆或者淹沒說話人信(xin)息，使得聲紋(wen)系統(tong)無法獲取準確(que)的(de)說話人聲紋(wen)特(te)征(zheng)。因此，應用聲紋(wen)識別技術的(de)產(chan)品(pin)大多適合(he)在(zai)相(xiang)對安(an)靜的(de)場合(he)使用。

標簽： 生物科技智能家居智能人工智能門禁安防 ★

關聯文章推薦

加載更多

網站提醒和聲明

本(ben)站(zhan)(zhan)為(wei)注冊(ce)用(yong)戶提供信息存儲空間服務，非“MAIGOO編輯上傳提供”的文章/文字(zi)均是(shi)注冊(ce)用(yong)戶自主(zhu)發(fa)布上傳，不(bu)(bu)代表本(ben)站(zhan)(zhan)觀(guan)點，更(geng)不(bu)(bu)表示本(ben)站(zhan)(zhan)支持購買和(he)交(jiao)易，本(ben)站(zhan)(zhan)對網頁中(zhong)內容的合法性(xing)、準(zhun)確性(xing)、真實性(xing)、適用(yong)性(xing)、安(an)全(quan)性(xing)等概不(bu)(bu)負(fu)責(ze)。版權歸(gui)原作者(zhe)所有，如有侵權、虛假信息、錯誤信息或任(ren)何問題，請(qing)及時(shi)聯系我們(men)，我們(men)將在(zai)第一時(shi)間刪除或更(geng)正。申請刪除>> 糾錯>> 投訴侵權>>

提交說明：快速提交發布>> 查看提交幫助>> 注冊登錄>>

贊

踩

發表評論

您還未登錄，依《網絡安全法》相關要求，請您登錄賬戶后再提交發布信息。點擊登錄>>如您還未注冊，可，感謝您的理解及支持！

芒果视频

聲紋識別是什么 帶你走進聽聲辨人的科技

聲紋識別是什么帶你走進聽聲辨人的科技