亚洲激情专区-91九色丨porny丨老师-久久久久久久女国产乱让韩-国产精品午夜小视频观看

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

RTVC 中 ASV 和 TTS 模塊結合使用的調研示例分析

發布時間:2022-01-14 22:30:12 來源:億速云 閱讀:153 作者:柒染 欄目:大數據

本篇文章為大家展示了RTVC 中 ASV 和 TTS 模塊結合使用的調研示例分析,內容簡明扼要并且容易理解,絕對能使你眼前一亮,通過這篇文章的詳細介紹希望你能有所收獲。

0. 說明

不知道如何克服 ASV 的輸出 SV Vector 應用到 TTS 后, 合成時候的 Unseen Speaker 問題

背景描述:

不管是 M2VoC 還是 音色遷移版本 Cross-lingual TTS, 均可以

  • 先用 ASV 得到音色向量

  • 這個向量不一定需要表述音色, 只需要同一個人集中就好

  • 然后這個向量結合文本參與 TTS 的訓練, 讓 TTS 熟悉向量

  • 但是如果未見過的說話人, 就需要 ASV 提取的比較準, 并且 TTS 的地方見到的人比較多

  • 比如 ASV 提取向量, 并且尋找離他最近的, 然后用他代替

  • 提取向量在訓練的時候, 是當前句子的向量, 但是 Inference 的時候可以隨機取 20 句話, 然后取平均

因此調研下文獻以及討論

1. 總結現象

  • 哪些 SVV 導致 Good Case

  • 哪些 SVV 導致 Bad Case

  • 都記錄下來, 進行觀察和二分類

2. 調研前的想法

2.1. 增多數據

不用更改思路, 增多 VCTK 類似的思路, 仔細訓練

主要貢獻可以體現在

  • 公開數據集的收集

  • 處理

  • 以及使用

  • 最終 Test 集的構建上

2.2. SVV 找最近

不用本身提取的 SVV, 尋找他最近的那個

2.3. 多個 ASV

  • 一個抓去不夠, 參考的少, 使用多個

  • 其中多個可以有中文的, 英文的

2.4. GST

使用 ASV 得到 SVV, 然后不直接使用 SVV, 而是通過 Attention 將 SVV 表示成幾個 GST 的加權和, 然后參與 TTS

2.5. ASV Fine-Tune

訓練的時候允許 ASV 進行梯度回傳的修改

  • 不過這個方法 TTS 語料只有 100 說話人級別, 而 ASV 語料都是 7000 級別, 因此不好訓

3. LibriSpeech TTS

  • 但是之前有人做到過很好的跨語言效果, 并且并沒有用到這么多說話人

  • 不過先用吧, 看能不能出效果

上述內容就是RTVC 中 ASV 和 TTS 模塊結合使用的調研示例分析,你們學到知識或技能了嗎?如果還想學到更多技能或者豐富自己的知識儲備,歡迎關注億速云行業資訊頻道。

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

tts
AI

岳普湖县| 嫩江县| 常熟市| 荣昌县| 招远市| 南靖县| 九台市| 拉萨市| 建阳市| 那坡县| 北宁市| 秭归县| 丰宁| 公安县| 五家渠市| 乌海市| 卓资县| 武汉市| 堆龙德庆县| 新田县| 抚州市| 肇州县| 天长市| 土默特右旗| 莒南县| 临安市| 柳河县| 专栏| 吉木乃县| 马关县| 深圳市| 凌源市| 玛曲县| 万年县| 页游| 剑阁县| 宿迁市| 交口县| 江川县| 穆棱市| 长沙市|