亚洲激情专区-91九色丨porny丨老师-久久久久久久女国产乱让韩-国产精品午夜小视频观看

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

Python實現JS解密并爬取網站

發布時間:2020-10-26 15:11:13 來源:億速云 閱讀:216 作者:Leah 欄目:開發技術

Python實現JS解密并爬取網站?很多新手對此不是很清楚,為了幫助大家解決這個難題,下面小編將為大家詳細講解,有這方面需求的人可以來學習下,希望你能有所收獲。

打開開發者工具

Python實現JS解密并爬取網站

選擇XHR標簽頁,沒有找到什么

再查看一下這些圖片的URL值

http://mhpic.xiaomingtaiji.net/comic/D%2F%E6%96%97%E7%A0%B4%E8%8B%8D%E7%A9%B9%E6%8B%86%E5%88%86%E7%89%88%2F20%E8%AF%9D%2F1.jpg-zymk.middle.webp

嘗試搜索圖片元素

Python實現JS解密并爬取網站Python實現JS解密并爬取網站

發現有一個js文件,打開搜索

Python實現JS解密并爬取網站

發現這里有一個疑點,這不是html里面的字段嗎,那么 “i.getPicUrl(e)” 不就是那個圖片的URL的值了嗎

在這里下一個斷點,走你

Python實現JS解密并爬取網站

果然,這個就那個圖片URL生成的切入點,現在就是看調用棧,找到這個函數的起點,點擊右側的 ”e.init“,這里有一個setInitData函數,從名字來看,應該就是設置初始數據的地方,在這里下一個斷點,進去看看

Python實現JS解密并爬取網站

這里有一個this.imgpath,這個應該就是圖片的URL值了,點擊F10,再單步調式,來到了charcode函數

Python實現JS解密并爬取網站

進去看看,這里應該就是加密函數了

Python實現JS解密并爬取網站

這里一步步調式,不要著急,來到了這里

Python實現JS解密并爬取網站

繼續單步調式,在第二次打開這么VM文件的時候,”__cr.imgpath“這個看起來很熟悉呀

Plain Text
"L-:N-M>-A>-A&#63;-M&#63;-I8-J<-M@-@J-@L-M&#63;-IA-JA-M>-@J-@>-M=-@@-@>-M&#63;-@A-@@-:N:8-M@-IN-AL-:N"

打開頁面源代碼,就在這里啦,不僅僅有圖片的URL加密值,還有其他數據,這些都是在后面圖片URL拼接需要使用到的

Python實現JS解密并爬取網站

現在我們再重新看看那個加密函數,它無非就是遍歷那個加密值的每個字符,獲取其Unicode值,再與__cr.chapter_id進行相關運算,然后再得到的Unicode數值返回字符

現在我們可以用python仿寫這個算法

Python實現JS解密并爬取網站

接下就是平常get請求獲取必要的數據了,通過正則獲取元素,拼接,以下是源碼

Python實現JS解密并爬取網站 看完上述內容是否對您有幫助呢?如果還想對相關知識有進一步的了解或閱讀更多相關文章,請關注億速云行業資訊頻道,感謝您對億速云的支持。

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

会同县| 徐汇区| 罗甸县| 会宁县| 偃师市| 宁明县| 新兴县| 兰西县| 都兰县| 淄博市| 建昌县| 纳雍县| 乾安县| 霍城县| 五莲县| 巴南区| 论坛| 营口市| 临洮县| 淳安县| 新干县| 尖扎县| 长白| 瓦房店市| 巴东县| 商河县| 大悟县| 修武县| 古蔺县| 余干县| 靖安县| 时尚| 乌苏市| 湛江市| 长汀县| 伊春市| 屏东市| 冕宁县| 宁化县| 中西区| 公主岭市|