<meter id="pryje"><nav id="pryje"><delect id="pryje"></delect></nav></meter>
          <label id="pryje"></label>

          新聞中心

          EEPW首頁 > 智能計算 > 業(yè)界動態(tài) > 阿里公布新語音合成技術(shù) 錄音10分鐘定制AI語音

          阿里公布新語音合成技術(shù) 錄音10分鐘定制AI語音

          作者: 時間:2019-07-12 來源:新浪科技 收藏

          近日,發(fā)布新一代語音合成技術(shù)KAN-TTS,稱可大幅提高合成語音與真人發(fā)聲的相似度,并將語音合成定制成本降低10倍以上。該技術(shù)由達摩院機器智能實驗室自主研發(fā)。

          本文引用地址:http://www.ex-cimer.com/article/201907/402617.htm

          阿里方面稱,當(dāng)前業(yè)界商用系統(tǒng)的合成語音與原始音頻錄音的接近程度通常在85%到90%之間,而基于KAN-的合成語音可將該數(shù)據(jù)提高到97%以上。

          據(jù)悉,KAN-TTS由達摩院機器智能實驗室自主研發(fā),深度融合了目前主流的端到端和傳統(tǒng),從多個方面改進了語音合成。傳統(tǒng)語音合成定制需要10小時以上的數(shù)據(jù)錄制和標(biāo)注,對錄音人和錄音環(huán)境要求很高。從啟動定制到最終交付,項目周期長成本高。

          阿里利用Multi-Speaker Model與Speaker-aware Advanced Transfer Learning相結(jié)合的方法,將語音合成定制成本降低10倍以上,周期壓縮3倍以上。也就是說,用1小時有效錄音數(shù)據(jù)和不到兩個月制作周期,就能完成一次標(biāo)準(zhǔn)TTS定制。

          此外,這使得普通用戶定制“AI聲音”的門檻更低。只需手機錄音十分鐘,就能獲得與錄制聲音高度相似的合成語音。



          評論


          相關(guān)推薦

          技術(shù)專區(qū)

          關(guān)閉
          看屁屁www成人影院,亚洲人妻成人图片,亚洲精品成人午夜在线,日韩在线 欧美成人 (function(){ var bp = document.createElement('script'); var curProtocol = window.location.protocol.split(':')[0]; if (curProtocol === 'https') { bp.src = 'https://zz.bdstatic.com/linksubmit/push.js'; } else { bp.src = 'http://push.zhanzhang.baidu.com/push.js'; } var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(bp, s); })();