您好,登錄后才能下訂單哦!
這篇文章主要介紹了Python如何爬取微信讀書實現讀書免費自由,具有一定借鑒價值,感興趣的朋友可以參考下,希望大家閱讀完這篇文章之后大有收獲,下面讓小編帶著大家一起了解一下。
不知道用微信讀書的朋友多不多,這里順便安利一下哈。
我目前看電子書的話基本都是在用微信讀書,畢竟無限卡真香。
在微信讀書上,不僅很多正版的Python書籍電子書可以直接看,還可以在閱讀的同時看別人寫的標注。
但是無限卡對于小說不太友好,只能閱讀開頭的章節,后面的章節就需要變相付費了。
雖然知道番茄小說,七貓小說這種都能免費看,但是實在不愿意為了一部小說再多下一個軟件。
幸虧微信讀書出了一個功能——可以自己上傳書籍,支持支持txt、pdf、epub格式。
這就給了我一個想法,只需要將小說下載到本地,再導入到微信讀書不就成了。
下載小說方法賊簡單,用Python也行,搜搜專門打包好的下載器也成。不過我記得兩年前剛學Python時自己練習寫過筆趣閣的爬蟲,這就翻出來用用。
原來代碼是找到了,但是很尷尬,我爬取的那個網站404了。
不過目前筆趣閣遍地都是,也分不清到底誰是“正版”的?
還有個比較好的消息,很多家連網頁模板都是一模一樣,你的爬蟲改改地址就能接著用了,這是妙啊。
于是乎,我又隨便找了一家“筆趣閣”。
今天我們就以我吃西紅柿近期完結的滄元圖
為例,可以看到在這個筆趣閣網站里,小說滄元圖的網址url是
https://*********/html/2292/
同時,《滄元圖》所有的章節也都羅列在本頁面。
我覺得先爬取所有的章節名和對應的url網址,分別保存到列表中。然后再使用requests爬取,并依次寫入txt文檔中。
網頁結構并不復雜,也沒有反爬措施。大概20行代碼即可下載
for i, j in zip(urls, names): res_text = requests.get(url, headers=header).text zj_html = etree.HTML(res_text) texts = zj_html.xpath('//*[@id="content"]/text()') texts2 = zj_html.xpath('//*[@id="content"]/*/text()') text = '\n'.join(texts).strip()+'\n'.join(texts2).strip() with open('novels_n.txt', 'a', encoding='utf8') as f: f.write(f'{j} \n {text} \n') print(f'{novels_n}/{j},正在下載...')
這樣我們就爬取了小說《滄元圖》,并將它保存成txt文檔。
通過\n
使得章節名都與正文分割開。
下面的步驟就更簡單了,只需要在微信讀書的網頁版中,點擊【傳書到手機】,上傳剛剛爬取生成的《滄元圖》。
導入成功。
單擊【立即閱讀】,享受一下勞動成果。
整體段落和文字都沒什么問題。
再看一下章節目錄,也是按照正常的目錄進行排版的。
非常完美!
感謝你能夠認真閱讀完這篇文章,希望小編分享的“Python如何爬取微信讀書實現讀書免費自由”這篇文章對大家有幫助,同時也希望大家多多支持億速云,關注億速云行業資訊頻道,更多相關知識等著你來學習!
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。