亚洲激情专区-91九色丨porny丨老师-久久久久久久女国产乱让韩-国产精品午夜小视频观看

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

「docker實戰篇」python的docker-抖音視頻抓取-總結(下)(26)

發布時間:2020-07-14 10:00:42 來源:網絡 閱讀:623 作者:IT人故事 欄目:云計算

從19到24節都說的抖音數據的抓取,從web端用戶信息抓取,app端粉絲數據抓取,視頻數據。

「docker實戰篇」python的docker-抖音視頻抓取-總結(下)(26)

(一)抓取三大塊
  • 1.web端用戶信息抓取

「docker實戰篇」python的docker-抖音視頻抓取-總結(下)(26)

技術困難:
個人數據界面-TTF混淆

「docker實戰篇」python的docker-抖音視頻抓取-總結(下)(26)

解決方案:
枚舉的方式分析出來數字

「docker實戰篇」python的docker-抖音視頻抓取-總結(下)(26)

注意事項:
通過TTF字體數據對應,如果抖音TTF字體庫發生改變,爬蟲也需要做對應修改。

  • 2.app端粉絲數據獲取

「docker實戰篇」python的docker-抖音視頻抓取-總結(下)(26)

技術困難:
appium模擬滑動+mitmdump解析數據
通過一臺設備抓取比較慢,多設備多進程抓取抖音的數據

「docker實戰篇」python的docker-抖音視頻抓取-總結(下)(26)

注意事項:
1.appium模擬滑動抖音粉絲數據,一個名人一般僅能獲取5000條粉絲數據。
2.移動設備設置代理進行抓包后,如遇到無法聯網或無法解析https數據時,需要安裝Xposed框架+JustTrustme組件進行屏蔽證書的校驗。如果用真實手機建議直接刷個帶Xposed框架和開通Root權限的系統,為了避免【變磚】。
3.在設置多設備,多進程數據抓取時,需要設置appium服務端的bootstrap端口,以及客戶端的udid字段。

「docker實戰篇」python的docker-抖音視頻抓取-總結(下)(26)

  • 3.web端視頻數據抓取

「docker實戰篇」python的docker-抖音視頻抓取-總結(下)(26)

技術困難:
破解js獲取signature,通過瀏覽器獲取到signature

「docker實戰篇」python的docker-抖音視頻抓取-總結(下)(26)

注意事項:
視頻抓取,需要破解signature字段,使用拼接html,解析js

技術參考:
https://douyin.wlansq.cn/

「docker實戰篇」python的docker-抖音視頻抓取-總結(下)(26)

2個請求中,getjs里面有個tac,最早的時候一直獲取不到數據,后來才知道原來是tac 沒有獲取。

「docker實戰篇」python的docker-抖音視頻抓取-總結(下)(26)

PS:

1.數據抓取的時,需要加上代理,偽裝爬蟲
2.條件允許最好還是使用真實移動設備,最好使用小米,華為的安全性太高了。國產的華為手機安全要求很高,不插入手機卡,usb調試模式都打不開。破解系統還需要收費。
3.小米刷機一般使用【刷機大師】,【刷機精靈】,(【線刷寶】會安裝一些流氓軟件,但是線刷寶確實好用,忍著吧)


向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

吉隆县| 泽州县| 赣榆县| 邹城市| 海城市| 天峻县| 平利县| 楚雄市| 安化县| 章丘市| 彩票| 桃源县| 正蓝旗| 墨脱县| 纳雍县| 东阿县| 大渡口区| 永和县| 大埔区| 天长市| 高州市| 班玛县| 青冈县| 长寿区| 普定县| 西畴县| 湟源县| 大埔县| 淮阳县| 额济纳旗| 嘉荫县| 秦安县| 饶平县| 泉州市| 广宗县| 武功县| 济源市| 五峰| 祁阳县| 康乐县| 汨罗市|