您好,登錄后才能下訂單哦!
這篇文章主要為大家展示了“python騰訊語音合成的示例分析”,內容簡而易懂,條理清晰,希望能夠幫助大家解決疑惑,下面讓小編帶領大家一起研究并學習一下“python騰訊語音合成的示例分析”這篇文章吧。
一、騰訊語音合成介紹
騰訊云語音合成技術(TTS)可以將任意文本轉化為語音,實現讓機器和應用張口說話。 騰訊TTS技術可以應用到很多場景,比如,移動APP語音播報新聞;智能設備語音提醒;依靠網上現有節目或少量錄音,快速合成明星語音,降低邀約成本;支持車載導航語音合成的個性化語音播報。
二、騰訊語音合成python SDK文檔
安裝 Python SDK 前,先獲取安全憑證。在第一次使用云 API 之前,用戶首先需要在騰訊云控制臺上申請安全憑證,安全憑證包括 SecretID 和 SecretKey, SecretID 是用于標識 API 調用者的身份,SecretKey 是用于加密簽名字符串和服務器端驗證簽名字符串的密鑰。SecretKey 必須嚴格保管,避免泄露。
通過 pip 安裝(推薦)
您可以通過 pip 安裝方式將騰訊云 API Python SDK 安裝到您的項目中,如果您的項目環境尚未安裝 pip,請詳細參見 pip官網 安裝。
通過pip方式安裝請在命令行中執行以下命令:
pip install tencentcloud-sdk-python
請注意,如果同時有 python2 和 python3 環境, python3 環境需要使用 pip3 命令安裝。
三、騰訊語音合成
# !/usr/bin/env python 2 # -*- coding: utf-8 -*- from base64 import b64decode from uuid import uuid4 from tencentcloud.common import credential from tencentcloud.common.exception.tencent_cloud_sdk_exception import TencentCloudSDKException from tencentcloud.aai.v20180522.models import TextToVoiceRequest from tencentcloud.aai.v20180522.aai_client import AaiClient try: # 實例化一個認證對象,入參需要傳入騰訊云賬戶secretId,secretKey cred = credential.Credential("你的secretID", "你的secretKey") # 實例化要進行語音合成請求的client對象 client = AaiClient(cred, 'ap-shanghai') # 實例化一個請求對象 req = TextToVoiceRequest() # 請求對象屬性封裝 req.Text = '先帝創業未半而中道崩殂' # type: str # 要合成語音的文本 req.SessionId = uuid4() # type: int # 一次請求對應一個SessionId,會原樣返回,建議傳入類似于uuid的字符串防止重復 req.ModelType = 1 # type: int # 模型類型,默認值為1 req.Volume = 5.0 # type: float # 音量大小,范圍:[0,10],分別對應10個等級的音量,默認為0 req.Speed = 0.6 # type: float # 語速,范圍:[-2,2],分別對應不同語速:0.6倍,0.8倍,1.0倍,1.2倍,1.5倍,默認為0 req.ProjectId = 10086 # type: int # 項目id,用戶自定義,默認為0 req.VoiceType = 0 # type: int # 音色0:女聲1,親和風格(默認) 音色1:男聲1,成熟風格 音色2:男聲2,成熟風格 req.PrimaryLanguage = 1 # type: int # 主語言類型1:中文,最大100個漢字(標點符號算一個漢字)語言類型2:英文,最大支持400個字母(標點符號算一個字母) req.SampleRate = 16000 # type: int # 音頻采樣率,16000:16k,8000:8k,默認16k # 通過client對象調用想要訪問的接口,需要傳入請求對象 rep = client.TextToVoice(req) # rep為響應對象 print(rep) """ { "Audio": "UklGRlR/AABXQVZFZm10IBAAAAABAAEAgD4AAAB9AAACABAAZGF0YSx9AAD+////AQD//wAAAAAAAAIAAQADAAMABgAEAAYABQAGAAUABwAIAAgACQAAE......AAgACAAEAAgADAAIAAwACAAQAAwACAAIAAgADAAMAAgACAAIAAwABAAAAAAAAAAAAAAD/////AAAAAAAA//8AAP///v/9//7//v///////v8AAP///////wAA/////wAA/////wAAAAAAAAAAAAAAAAAAAAAAAAAA", "RequestId": "9a7a1615-3e09-4db2-8032-5c6f497f7e6a", "SessionId": "session-1234" } Audio對應的值為經過base64編碼, RequestId為返回的唯一請求id, SessionId為發送請求時傳入的id即uuid4() """ # content為base64解碼后的二進制流 content = b64decode(rep.Audio) # I/O操作 with open('voice.wav', 'wb') as f: f.write(content) except TencentCloudSDKException as e: print(e)
以上是“python騰訊語音合成的示例分析”這篇文章的所有內容,感謝各位的閱讀!相信大家都有了一定的了解,希望分享的內容對大家有所幫助,如果還想學習更多知識,歡迎關注億速云行業資訊頻道!
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。