發(fa)布語(yu)音(yin)合(he)成技(ji)術(shu)(shu)KAN-TTS,基(ji)于KAN-TTS技(ji)術(shu)(shu)的合(he)成語(yu)音(yin)可將該數(shu)據提高到97%以上。融合(he)了(le)端到端TTS技(ji)術(shu)(shu)和傳統(tong)TTS技(ji)術(shu)(shu),從多個方面改進(jin)了(le)語(yu)音(yin)合(he)成。普通用戶定制“AI聲(sheng)音(yin)”的門檻(jian)更低了(le)。
發布(bu)語(yu)音合成技術KAN-TTS,據介紹,該技術可(ke)大幅提高合成語音與(yu)真(zhen)人發聲的相似度,并(bing)將語音合成定制成本降低10倍(bei)以上。
KAN-TTS技術由達摩院機器智能實驗室(shi)自主研發。阿里(li)方(fang)面稱(cheng),基于KAN-TTS技術的合成語音可(ke)將該數據提高到97%以上。
據(ju)悉,KAN-TTS深度融合(he)了(le)端(duan)到端(duan)TTS技術和傳統TTS技術,從多個方面(mian)改進了(le)語音合成。傳統語音合成定制需(xu)要10小時以上的數據(ju)錄制(zhi)和(he)(he)標注,對錄音(yin)(yin)人(ren)和(he)(he)錄音(yin)(yin)環境要求很(hen)高。從啟動定制(zhi)到(dao)最終交(jiao)付,項目(mu)周期長成本高。
而阿里利用(yong)Multi-Speaker Model與Speaker-aware Advanced Transfer Learning相結合的(de)方法,將語音合成定制周期壓縮3倍以(yi)上。也就是說,用1小時有效錄音數據和不到兩個(ge)月制作周(zhou)期,就能完成一次標準TTS定制。
此外,這使得普(pu)通用(yong)戶定制(zhi)“AI聲音(yin)(yin)”的(de)門檻更低。只需手機錄音(yin)(yin)十(shi)分鐘,就能獲得與錄制聲音(yin)(yin)高度相(xiang)似的(de)合成(cheng)語(yu)音(yin)(yin)。
阿里巴巴集團正式在香港交易(yi)所掛牌上市(shi),成為首個同(tong)時在美股和港股上市(shi)的中國互聯(lian)網公司。這個行...
杭州2022年第19屆亞運(yun)(yun)會組委會宣布,阿(a)里(li)巴巴成為(wei)杭州亞運(yun)(yun)會官方合作伙伴。作為(wei)創(chuang)新技(ji)術,...
阿里巴(ba)巴(ba)集團正式在港交(jiao)所掛牌(pai)上(shang)市,開盤187港元,阿里巴(ba)巴(ba)此次發行5億股新股,另(ling)有7500...
收(shou)購是(shi)企(qi)業(ye)資本經營的(de)一(yi)種(zhong)形式,是(shi)一(yi)個公司通過產權(quan)交易取得其他公司一(yi)定程度(du)的(de)控制權(quan),以實現一(yi)...