亚洲激情专区-91九色丨porny丨老师-久久久久久久女国产乱让韩-国产精品午夜小视频观看

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

nodejs制作小爬蟲功能示例

發布時間:2020-09-23 20:21:10 來源:腳本之家 閱讀:119 作者:巴啦啦小能量 欄目:web開發

本文實例講述了nodejs制作小爬蟲功能。分享給大家供大家參考,具體如下:

1 安裝nodejs

2 安裝需要模塊

npm install request cheerio 

3 新建js文件

4 引入

const request=require("request")
const cheerio=require("cheerio")

5 利用request模塊發送請求

request('http://news.dgut.edu.cn/dgut/xydt/news_list.shtml',function(err,res){
  if(err)
  {
    console.log('請求出錯');
  }
  else
  {
    var $ = cheerio.load(res.body, {decodeEntities: false});
    $('.listList').children('ul').children('li').each(function(){ //找到li元素對象然后通過each遍歷
      var newsTitle = $(this).children('a').text(); //得到<a>標簽的文字
      var newsTime= $(this).children('span').eq(1).text();//得到第二個<span>標簽的文字
      var newsUrl= "http://news.dgut.edu.cn"+$(this).children('a').attr('href');//得到<a>標簽的href的值
    item++;
    console.log("已爬取"+item+"條記錄");
    });
  }
});

一個小爬蟲案例就完了

附上完整代碼

request('http://news.dgut.edu.cn/dgut/xydt/news_list.shtml',function(err,res){
  if(err)
  {
    console.log('請求出錯');
  }
  else
  {
    var $ = cheerio.load(res.body, {decodeEntities: false});
    $('.listList').children('ul').children('li').each(function(){ //找到li元素對象然后通過each遍歷
      var newsTitle = $(this).children('a').text(); //得到<a>標簽的文字
      var newsTime= $(this).children('span').eq(1).text();//得到第二個<span>標簽的文字
      var newsUrl= "http://news.dgut.edu.cn"+$(this).children('a').attr('href');//得到<a>標簽的href的值
    item++;
    console.log("已爬取"+item+"條記錄");
    });
  }
});

下面的帶數據庫

const request=require("request")
const cheerio=require("cheerio")
const mysql=require('mysql')
const db=mysql.createPool({host:'120.79.5554',user:'root',password:'root',database:'pachong'});
var item=0;
request('http://news.dgut.edu.cn/dgut/xydt/news_list.shtml',function(err,res){
  if(err)
  {
    console.log('請求出錯');
  }
  else
  {
    var $ = cheerio.load(res.body, {decodeEntities: false});
    $('.listList').children('ul').children('li').each(function(){ //找到li元素對象然后通過each遍歷
      var newsTitle = $(this).children('a').text(); //得到<a>標簽的文字
      var newsTime= $(this).children('span').eq(1).text();//得到第二個<span>標簽的文字
      var newsUrl= "http://news.dgut.edu.cn"+$(this).children('a').attr('href');//得到<a>標簽的href的值
      console.log(newsTitle,newsTime,newsUrl)
      db.query(`INSERT INTO news (newsTitle, newsTime, newsUrl) VALUE('${newsTitle}', '${newsTime}','${newsUrl}')`,function(err,data){
      if(err)
      {
        console.log("數據庫連接錯誤");
      }
    })
    item++;
    console.log("已爬取"+item+"條記錄");
    });
  }
});

希望本文所述對大家node.js程序設計有所幫助。

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

观塘区| 南阳市| 武隆县| 镇赉县| 灵山县| 健康| 墨竹工卡县| 宝丰县| 龙泉市| 奉贤区| 怀远县| 武穴市| 乌拉特后旗| 惠东县| 曲沃县| 精河县| 永城市| 简阳市| 友谊县| 潜江市| 罗山县| 蒙自县| 阳泉市| 青州市| 静宁县| 米脂县| 孟村| 长阳| 凯里市| 晴隆县| 盐城市| 衡水市| 图木舒克市| 宁河县| 澎湖县| 洪雅县| 郧西县| 松桃| 扶绥县| 青冈县| 那曲县|