亚洲激情专区-91九色丨porny丨老师-久久久久久久女国产乱让韩-国产精品午夜小视频观看

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

【python小項目】抓取編程網收費vip文章的非vip用戶觀看界面的url

發布時間:2020-07-24 23:29:09 來源:網絡 閱讀:396 作者:老肖的博客 欄目:編程語言


#!/usr/bin/python3
#coding=UTF-8
import?requests
from?bs4?import?BeautifulSoup

'''
需求:【python小項目】抓取編程網收費vip文章的非vip用戶觀看界面的url!?例如收費文章http://c.biancheng.net/view/vip_6005.html對應非收費地址是http://c.biancheng.net/view/5315.html這個網站總是有一些vip文章??但是vip文章通過百度標題是可以搜索到的,我想爬取所有這樣的文章標題和網頁的地址!后期看到一個vip文章,你可以通過檢索標題得到非vip的觀看鏈接地址
編寫日期:2019-10-18
作者:xiaoxiaohui
說明:python3程序?而且最好在linux運行?windows下有gbk那個編碼問題
'''

def?get_biaoti(url):
	response?=?requests.get(url)
	response.encoding='utf-8'?#如果不設置成utf8則中文亂碼或者報錯?參考https://www.cnblogs.com/supery007/p/8303472.html
	soup?=?BeautifulSoup(response.text,'html.parser')
	links_div?=?soup.find_all('h2')
	return?links_div[0].text

f?=?open("a1.txt",?'a')
for?yema?in?range(1,500):
	url?=?'http://c.biancheng.net/view/'+str(yema)+'.html'
	biaoti?=?get_biaoti(url)
	print(url,biaoti)?
	f.write(url+'\t'+biaoti+'\n')
f.close()


運行結果、收集到的文章和url對應關系截圖:

【python小項目】抓取編程網收費vip文章的非vip用戶觀看界面的url

自己學到的:

  1. 這次學到的? 原來我的爬蟲都是爬某個div的,都是links_div = soup.find_all('div',class_="listpic"), 原來也可以直接links_div = soup.find_all('h2'),也就是帶一個參數這樣的




向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

米林县| 余姚市| 延庆县| 清水县| 时尚| 酒泉市| 沙湾县| 云南省| 安阳县| 长汀县| 昌邑市| 南安市| 固原市| 佛冈县| 苍山县| 尚义县| 南丹县| 日喀则市| 苏尼特右旗| 松桃| 奉化市| 桃江县| 武威市| 淮北市| 四子王旗| 米林县| 会理县| 乐亭县| 公主岭市| 卢湾区| 敦煌市| 昌吉市| 兴城市| 乌兰察布市| 张家界市| 唐山市| 合作市| 阿坝县| 涟源市| 东山县| 山丹县|