亚洲激情专区-91九色丨porny丨老师-久久久久久久女国产乱让韩-国产精品午夜小视频观看

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

怎么在Node.JS中利用PhantomJs對網頁進行抓取

發布時間:2020-12-22 15:31:51 來源:億速云 閱讀:442 作者:Leah 欄目:web開發

本篇文章為大家展示了怎么在Node.JS中利用PhantomJs對網頁進行抓取,內容簡明扼要并且容易理解,絕對能使你眼前一亮,通過這篇文章的詳細介紹希望你能有所收獲。

前言

當想用 nodejs 抓取一些網頁 , 我第一反應想到的就是使用 http 模塊 , 比如抓取百度首頁:

var http = require('http');
var req = http.request('http://www.baidu.com/', function (res) {
 res.setEncoding('utf8');
 res.on('data', function (chunk) {
  //響應內容
  console.log(chunk)
 });
});
req.end(function () {
 // console.log('連接關閉');
});

但是 , 這僅限于簡單地抓取 html , 有很大的局限性。

假如你想要的內容不在 html 里 , 而是 js 動態生成的 , 那 http 模塊就不能滿足你的需求了 ;

假如網頁使 gbk 編碼的 , 上述方法也不太好用了。

假如是 https 上述方法也要改一改了。

我渴望一個更強大 , 但使用起來也不麻煩的工具。

PhantomJs

用 PhantomJs 就可以解決上述問題。

PhantomJs 就是一個沒有界面的瀏覽器。

安裝

使用 cnpm 安裝 PhantomJS 即可:

cnpm install phantomjs --save-dev

這里我沒有選擇全局安裝 , 因為全局安裝的話 , 別人使用我的源碼的時候 , 不知道還有這么一個依賴 , 項目就跑不起來了。

如果你也選擇局部安裝 , 那么你需要在 package.json 里的 scripts 中加入一段 :

"phantomjs":"node_modules/.bin/phantomjs"

等下會用到這個的 , 到這里 , 安裝算完成了。

寫代碼

我們新建一個文件 , 名字隨意 , 這里我新建一個 main.js :

var webpage = require('webpage');
var page = webpage.create();
page.open('http://www.baidu.com/', function (status) {
 var data;
 if (status === 'fail') {
  console.log('open page fail!');
 } else {
  console.log(page.content);//打印出HTML內容
 }
 page.close();//關閉網頁
 phantom.exit();//退出phantomjs命令行
});

這里有個 webpage 模塊 , 我們剛才明明沒有這個模塊 , 為什么能引用這個模塊 ???

當然不能引用 , 假如我們使用 node main.js 來跑這段代碼 , 是跑不起來的 , 應該這樣運行這段代碼 :

npm run phantomjs main.js

這里的 npm run phantomjs 對應的就是前面我們在 package.json 里加入的那段命令 , 很方便吧 , 幾乎和 http 模塊一樣方便。

page.content 就是 html 代碼了 , 這個 page 對象還有很多的屬性 , 功能更強大。

到這里 , 你就已經算入門了 , 想知道更多可以去 phantomjs 官網看看文檔了。

上述內容就是怎么在Node.JS中利用PhantomJs對網頁進行抓取,你們學到知識或技能了嗎?如果還想學到更多技能或者豐富自己的知識儲備,歡迎關注億速云行業資訊頻道。

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

天峨县| 蒙山县| 三明市| 启东市| 巧家县| 宁强县| 凤冈县| 观塘区| 措勤县| 宁安市| 荔浦县| 阳泉市| 五河县| 泊头市| 县级市| 镇平县| 布拖县| 敖汉旗| 亳州市| 竹山县| 泗水县| 唐河县| 龙口市| 鲁山县| 鄂托克前旗| 囊谦县| 凤山市| 嵩明县| 蒙山县| 南木林县| 咸阳市| 玉林市| 宿迁市| 卓资县| 黎平县| 招远市| 通道| 池州市| 余庆县| 道真| 德兴市|