數碼錄音筆工作原理
數碼(ma)錄音筆通過對(dui)聲(sheng)音的(de)模擬信號(hao)(hao)的(de)采樣、編碼(ma),將模擬信號(hao)(hao)通過數模轉換(huan)器轉換(huan)為數字信號(hao)(hao),并進行壓(ya)縮后進行存儲。
智能錄音筆工作原理
語音(yin)交互(hu),只需(xu)要短短幾(ji)秒鐘便可翻譯(yi)出文(wen)字。所謂語音(yin)轉換成(cheng)文(wen)字用到了語音(yin)交互(hu)中(zhong)一項ASR技術。
建立聲(sheng)學(xue)模型:由于(yu)每個(ge)人發音、語調、語速等各不(bu)相同,需要將同一(yi)個(ge)單詞(ci)或漢字(zi)讓不(bu)同用(yong)戶錄取(qu),以(yi)便機(ji)器識別更(geng)多的人。聲(sheng)學(xue)模型建立過程需要錄入大量的原始用(yong)戶聲(sheng)音,以(yi)從中提取(qu)特征(zheng)建立聲(sheng)學(xue)模型數據庫。
建立語(yu)言模(mo)型:同聲學(xue)模(mo)型,也(ye)需要大量文字信(xin)息的儲存。語(yu)言模(mo)型可以(yi)對聲學(xue)模(mo)型進(jin)行匹配與調整(zheng),讓正確率(lv)盡(jin)可能提高,語(yu)句更加通順。
語(yu)音識別:有前兩步作(zuo)為基礎(chu)的(de)(de)情況下,最終(zhong)形成的(de)(de)數據庫存儲(chu)在設備本地或(huo)(huo)云端,再進行實(shi)時(shi)語(yu)音識別。將(jiang)用戶的(de)(de)語(yu)音輸入(ru)進行編碼和特(te)征提(ti)取(qu),將(jiang)提(ti)取(qu)到的(de)(de)特(te)征拿到聲學模(mo)型(xing)庫中去查(cha)詢(xun)(xun),得(de)到單(dan)個的(de)(de)單(dan)詞(ci)或(huo)(huo)漢(han)字(zi);然后再拿到語(yu)言模(mo)型(xing)庫中去查(cha)詢(xun)(xun),得(de)到最匹配的(de)(de)單(dan)詞(ci)或(huo)(huo)漢(han)字(zi)。