您好,登錄后才能下訂單哦!
這篇文章主要介紹Python中Web版語音合成的示例分析,文中介紹的非常詳細,具有一定的參考價值,感興趣的小伙伴們一定要看完!
前言
語音合成技術能將用戶輸入的文字,轉換成流暢自然的語音輸出,并且可以支持語速、音調、音量設置,打破傳統文字式人機交互的方式,讓人機溝通更自然。
應用場景
將游戲場景中的公告、任務或派單信息通過語音播報,讓玩家玩游戲或配送員送貨的同時,也可接聽新任務。
文學小說類軟件,可以利用百度語音合成技術將文學小說作品進行高質量的朗讀,流暢清晰,解放雙眼,暢聽世界。
軟件架構
Python3.7.2、Django2.1.7、baidu-aip(百度語音API)
案例
這里只展示部分代碼,有興趣的同學可以自行下載源碼安裝調試。
import os import time import codecs from aip import AipSpeech from django.shortcuts import render from django.http import HttpResponse ''' pip install --upgrade pip pip install django pip install baidu-aip ''' def main(request): return render(request, 'index.html') def m_main(request): return render(request, 'm_index.html') def convert(request): message = request.POST.get("message") switch = request.POST.get("switch") mp3 = du_say(message, switch) return HttpResponse(mp3) def du_say(message, switch): write_txt(message) app_id = '*****' api_key = '*****' secret_key = '*****' client = AipSpeech(app_id, api_key, secret_key) if switch == "true": switch = 3 else: switch = 4 result = client.synthesis(message, 'zh', 1, { 'vol': 5, 'per': switch, }) t = time.time() now_time = lambda: int(round(t * 1000)) path = os.getcwd() + os.path.sep + "static" + os.path.sep + "audio"+os.path.sep audio = path+str(now_time())+'.mp3' # 識別正確返回語音二進制 錯誤則返回dict 參照下面錯誤碼 if not isinstance(result, dict): with open(audio, 'wb') as f: f.write(result) return str(now_time())+'.mp3' def write_txt(message): t = time.time() now_time = lambda: int(round(t * 1000)) path = os.getcwd() + os.path.sep + "static" + os.path.sep + "text"+os.path.sep text = path+str(now_time())+'.txt' with codecs.open(text, 'a', encoding='utf8')as f: f.write(message)
本地部署
從碼云拉取項目到本地:
https://gitee.com/52itstyle/baidu-speech.git
配置百度語音API:
# 自行注冊申請 https://console.bce.baidu.com/ai/#/ai/speech/app/list
啟動項目:
# 切換到項目根目錄,執行 manage.py runserver
外網部署
這里以Linux為例,代理使用 openresty。
安裝 Python3
wget https://www.python.org/ftp/python/3.7.1/Python-3.7.1.tar.xz
事先安裝依賴,否則后期安裝會報錯:
yum -y install zlib* yum -y install libffi-devel
下面開始正式安裝:
# 解壓 tar -xvf Python-3.7.1.tar.xz # 切換大目錄 cd Python-3.7.1 # 配置編譯 ./configure # 編譯安裝 make && make install
安裝 Django
pip install Django
安裝成功以后需要重新配置并編譯安裝 Python3:
# 配置編譯 ./configure # 編譯安裝 make && make install
安裝服務器 uwsgi
pip3 install uwsgi
上傳項目到服務器,并切換到 speech 目錄:
# 目錄下新建文件夾 mkdir script
在 script 下新增 uwsgi.ini (項目中已經配置好,自行修改路徑即可):
# uwsig使用配置文件啟動 [uwsgi] # 項目目錄 chdir=/www/speech/ # 指定項目的application module=speech.wsgi:application # 指定sock的文件路徑 socket=/www/speech/script/uwsgi.sock # 進程個數 workers=5 pidfile=/www/speech/script/uwsgi.pid # 指定IP端口 http=127.0.0.1:8001 # 指定靜態文件 static-map=/static=/www/speech/static # 啟動uwsgi的用戶名和用戶組 uid=root gid=root # 啟用主進程 master=true # 自動移除unix Socket和pid文件當服務停止的時候 vacuum=true # 序列化接受的內容,如果可能的話 thunder-lock=true # 啟用線程 enable-threads=true # 設置自中斷時間 harakiri=30 # 設置緩沖 post-buffering=4096 # 設置日志目錄 daemonize=/www/speech/script/uwsgi.log
然后使用以下命令啟動:
uwsgi --ini uwsgi.ini
執行命令,查看是否啟動成功:
[root@AY140216131049Z script]# ps -ef|grep uwsgi root 3040 1 0 Nov21 ? 00:00:03 uwsgi --ini uwsgi.ini root 3041 3040 0 Nov21 ? 00:00:00 uwsgi --ini uwsgi.ini root 3042 3040 0 Nov21 ? 00:00:00 uwsgi --ini uwsgi.ini root 3043 3040 0 Nov21 ? 00:00:00 uwsgi --ini uwsgi.ini root 3044 3040 0 Nov21 ? 00:00:00 uwsgi --ini uwsgi.ini root 3045 3040 0 Nov21 ? 00:00:00 uwsgi --ini uwsgi.ini root 3046 3040 0 Nov21 ? 00:00:00 uwsgi --ini uwsgi.ini root 6606 6580 0 18:13 pts/0 00:00:00 grep --color=auto uwsgi
重啟:
uwsgi --reload uwsgi.pid
配置Nginx代理:
server { listen 80; server_name speech.52itstyle.vip; charset utf-8; location / { include uwsgi_params; # 導入一個Nginx模塊他是用來和uWSGI進行通訊的 uwsgi_connect_timeout 30; # 設置連接uWSGI超時時間 uwsgi_pass unix:/www/speech/script/uwsgi.sock; # 指定uwsgi的sock文件所有動態請求就會直接丟給他 } # 動靜分離 Nginx 處理靜態請求 location /static { root /www/speech/; } }
如果啟動HTTPS:
server { listen 80; listen 443 ssl; server_name speech.52itstyle.vip; #ssl on; #證書路徑 ssl_certificate /usr/local/openresty/nginx/cert/1901523_speech.52itstyle.vip.pem; #私鑰路徑 ssl_certificate_key /usr/local/openresty/nginx/cert/1901523_speech.52itstyle.vip.key; #緩存有效期 ssl_session_timeout 5m; #可選的加密算法,順序很重要,越靠前的優先級越高. ssl_ciphers ECDHE-RSA-AES128-GCM-SHA256:ECDHE:ECDH:AES:HIGH:!NULL:!aNULL:!MD5:!ADH:!RC4; #安全鏈接可選的加密協議 ssl_protocols TLSv1 TLSv1.1 TLSv1.2; ssl_prefer_server_ciphers on; location / { include uwsgi_params; # 導入一個Nginx模塊他是用來和uWSGI進行通訊的 uwsgi_connect_timeout 30; # 設置連接uWSGI超時時間 uwsgi_pass unix:/www/speech/script/uwsgi.sock; # 指定uwsgi的sock文件所有動態請求就會直接丟給他 } # 動靜分離 Nginx 處理靜態請求 location /static { root /www/speech/; } }
以上是“Python中Web版語音合成的示例分析”這篇文章的所有內容,感謝各位的閱讀!希望分享的內容對大家有幫助,更多相關知識,歡迎關注億速云行業資訊頻道!
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。