亚洲激情专区-91九色丨porny丨老师-久久久久久久女国产乱让韩-国产精品午夜小视频观看

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

php爬蟲如何運行

發布時間:2020-09-18 10:36:17 來源:億速云 閱讀:145 作者:小新 欄目:編程語言

php爬蟲如何運行?這個問題可能是我們日常學習或工作經常見到的。希望通過這個問題能讓你收獲頗深。下面是小編給大家帶來的參考內容,讓我們一起來看看吧!

 說到做爬蟲,大家都可能第一時間想到的是python,其實php也是可以用來寫爬蟲程序的。php一貫簡潔、易用,親測使用PHPspider框架能寫出一個簡單的爬蟲。

匹配方式使用XPach語法。  

<?php
require '/vendor/autoload.php';
use phpspider\core\phpspider;

/* Do NOT delete this comment */
/* 不要刪除這段注釋 */

$configs = array(
'name' => '簡書',
'log_show' =>false,
'tasknum' => 1,
//數據庫配置
'db_config' => array(
'host'  => '127.0.0.1',
'port'  => 3306,
'user'  => 'root',
'pass'  => '',
'name'  => 'demo',
),
'export' => array(
'type' => 'db',
'table' => 'jianshu',  // 如果數據表沒有數據新增請檢查表結構和字段名是否匹配
),
//爬取的域名列表  
'domains' => array(
    'jianshu',
    'www.jianshu.com'
), 
//抓取的起點
'scan_urls' => array(
    'https://www.jianshu.com/c/V2CqjW?utm_medium=index-collections&utm_source=desktop'
),
//列表頁實例
'list_url_regexes' => array(
    "https://www.jianshu.com/c/\d+"
),
//內容頁實例
//  \d+  指的是變量
'content_url_regexes' => array(
    "https://www.jianshu.com/p/\d+",
),
'max_try' => 5,

'fields' => array(
    array(
        'name' => "title",
        'selector' => "//h2[@class='title']",
        'required' => true,
    ),
    array(
        'name' => "content",
        'selector' => "//div[@class='show-content-free']",
        'required' => true,
    ),
),
);

$spider = new phpspider($configs);
$spider->start();

打完代碼后,記得根據要抓取的內容建立對應的數據庫、數據表,字段要能對對上。

接著cmd,輸入

php -f d:\jianshu\spider.php

運行如下

php爬蟲如何運行

感謝各位的閱讀!看完上述內容,你們對php爬蟲如何運行大概了解了嗎?希望文章內容對大家有所幫助。如果想了解更多相關文章內容,歡迎關注億速云行業資訊頻道。

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

php
AI

高淳县| 兴化市| 冀州市| 南江县| 沙河市| 依安县| 四子王旗| 寿光市| 梁河县| 清远市| 六枝特区| 应城市| 青田县| 苏尼特右旗| 兴化市| 县级市| 当阳市| 琼中| 祁阳县| 富源县| 朝阳区| 德州市| 甘德县| 徐水县| 如东县| 监利县| 渝北区| 南岸区| 洪泽县| 阿图什市| 山西省| 迁安市| 攀枝花市| 白水县| 仪陇县| 禹州市| 西乌珠穆沁旗| 泰和县| 开鲁县| 得荣县| 金华市|