發布語(yu)(yu)音(yin)(yin)合成(cheng)(cheng)技術(shu)(shu)(shu)KAN-TTS,基(ji)于KAN-TTS技術(shu)(shu)(shu)的合成(cheng)(cheng)語(yu)(yu)音(yin)(yin)可將該數據提高到(dao)(dao)97%以上。融合了(le)端到(dao)(dao)端TTS技術(shu)(shu)(shu)和傳統TTS技術(shu)(shu)(shu),從(cong)多個方(fang)面改(gai)進了(le)語(yu)(yu)音(yin)(yin)合成(cheng)(cheng)。普通用(yong)戶(hu)定制“AI聲音(yin)(yin)”的門檻更低了(le)。
發布語音(yin)合(he)成技(ji)術KAN-TTS,據介紹,該技術可大幅提(ti)高合成語音(yin)與(yu)真人發(fa)聲(sheng)的相似度,并(bing)將語音(yin)合成定制(zhi)成本降低(di)10倍以上。
KAN-TTS技(ji)術(shu)由達(da)摩院機器(qi)智能(neng)實驗室自主研(yan)發(fa)。阿里方面稱,基于KAN-TTS技術的合成(cheng)語音(yin)可將該數(shu)據提高到97%以上。
據悉(xi),KAN-TTS深(shen)度融(rong)合了端到端TTS技術和傳(chuan)統TTS技術,從多個方面改進了語音合成。傳(chuan)統語音合成定制需(xu)要10小(xiao)時以上的數據(ju)錄制(zhi)和標注,對(dui)錄音人和錄音環(huan)境要(yao)求很高(gao)。從啟(qi)動定(ding)制(zhi)到最終交付(fu),項目周期長(chang)成本高(gao)。
而阿里利用Multi-Speaker Model與Speaker-aware Advanced Transfer Learning相結(jie)合(he)的方法(fa),將語音(yin)合(he)成定制周期壓縮3倍以上(shang)。也(ye)就(jiu)是(shi)說,用1小時有效錄音數據和不到兩(liang)個月制作(zuo)周期,就(jiu)能(neng)完(wan)成一次標準TTS定制(zhi)。
此外,這使得普通用戶定(ding)制“AI聲音”的門檻更低。只需手(shou)機錄音十(shi)分鐘,就能獲得與(yu)錄制聲音高度相似的合成語(yu)音。
阿里巴巴集團(tuan)正式在(zai)香港交(jiao)易所掛牌上市,成為首個同時在(zai)美(mei)股和(he)港股上市的中國(guo)互聯網公司。這個行...
杭州2022年第19屆亞(ya)運(yun)會組委(wei)會宣布,阿里巴巴成為杭州亞(ya)運(yun)會官方合作伙(huo)伴。作為創新(xin)技術,...
阿(a)里巴(ba)巴(ba)集團正式(shi)在港交(jiao)所掛(gua)牌上(shang)市,開盤(pan)187港元,阿(a)里巴(ba)巴(ba)此次(ci)發行5億股新股,另有(you)7500...
收購(gou)是(shi)企業資本經營(ying)的一種形式,是(shi)一個公司通過產(chan)權交易取得(de)其他公司一定程度(du)的控制(zhi)權,以實現一...