您好,登錄后才能下訂單哦!
php采集程序構建基本步驟:
采集程序是什么?獲取遠程數據(文字、圖片、圖片)并快速保存到本地或指定地址。
如天氣預報(小偷程序):
遠程獲取--》替換內容--》展示給用戶
如實時更新的新聞(采集內容):
遠程獲取--》提取內容--》分類存儲--》讀取內容---》展示內容
*************************
設計PHP采集入庫UML
列表正則:
終端正則:
**************************
file_get_contents()獲取遠程頁面內容
preg_match_all()匹配列表
preg_match()匹配終端
preg_replace() :過濾終端
**************************
新建一個列表文件:lb.php
echo $con=file_get_cotents($_GET[url]);
$preg ="#<h2><a href='(.*)' target='_blank'>(.*)</a><span>#iUs";
pg_match_all($preg,$conn,$arr);
foreach($arr[1] as $id=>$v){
echo $v." "arr[2][$id]."<br>";
}
新建vi。php獲取標題
vi.php
$con=file_get_contents();
$preg="<title>(.*)</title>/iUs";//大小寫不敏感,防止貪婪匹配,防止換行
echo zz($preg,$con);
function zz($preg,$con,$num=1){
preg_match($preg,$con,$arr);
return $arr[$num];
}
echo $arr[1];//獲取標題
echo "<a href=vi.php?url=".$v.">".arr[2][$id]."<br>";
======================================
php100:83:采集程序
lb.php
<?php
if($_GET[id]){
$con=file_get_cotents($_GET[url].$_GET[id]."shtml");
$preg ="/<h2><a href='(.*)' target='_blank'>(.*)</a><span>/iUs";
perg_match_all($preg,$conn,$arr);
foreach($arr[1] as $id=>$v){
echo $v." "arr[2][$id]."<br>";
}
$_GET[id]++;
echo "<script>location.href='lb.php?id='.$_GET[id]."</script>";
}
?>
http://www.xinhuanet.com/finance/tzxx.htm
===============================================================
操作步驟:
1.新建一個數據庫caiji,tep_url表,id,title,content,11 ,100,150
2.新建一個conn.php,插入的語句可以通過phpmyadmin插入一個語句簡單的獲得
3.新建一個vi.php
4.單條入庫獲取下一條。
臨時的路徑列表:
完善我的入庫表。
假設刪刪除了其中的一條Id值,怎么辦?刪除了第9條!
多加一條語句
$sql2="select * from tmp_url where id>'$gid'order by id asc limit 1
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。