热烈祝贺台州朗动科技的站长论坛隆重上线!(2012-05-28)    热烈庆祝伟大的祖国60周年生日 点击进来我们一起为她祝福吧(2009-09-26)    站长论坛禁止发布广告,一经发现立即删除。谢谢各位合作!.(2009-08-08)    热烈祝贺台州网址导航全面升级,全新版本上线!希望各位一如既往地支持台州网址导航的发展.(2009-03-28)    台州站长论坛恭祝各位新年快乐,牛年行大运!(2009-01-24)    台州Link正式更名为台州网址导航,专业做以台州网址为主的网址导航!(2008-05-23)    热烈祝贺台州Link资讯改名为中国站长资讯!希望在以后日子里得到大家的大力支持和帮助!(2008-04-10)    热烈祝贺台州Link论坛改名为台州站长论坛!希望大家继续支持和鼓励!(2008-04-10)    台州站长论坛原[社会琐碎]版块更名为[生活百科]版块!(2007-09-05)    特此通知:新台州站长论坛的数据信息全部升级成功!">特此通知:新台州站长论坛的数据信息全部升级成功!(2007-09-01)    台州站长论坛对未通过验证的会员进行合理的清除,请您谅解(2007-08-30)    台州网址导航|上网导航诚邀世界各地的网站友情链接和友谊联盟,共同引领网站导航、前进!(2007-08-30)    禁止发广告之类的帖,已发现立即删除!(2007-08-30)    希望各位上传与下载有用资源和最新信息(2007-08-30)    热烈祝贺台州站长论坛全面升级成功,全新上线!(2007-08-30)    
便民网址导航,轻松网上冲浪。
台州维博网络专业开发网站门户平台系统
您当前的位置: 首页 » PHP/Perl编程 » PHP采集教程示例

PHP采集教程示例

论坛链接
  • PHP采集教程示例
  • 发布时间:2007-10-05 14:45:15    浏览数:4934    发布者:webptr    设置字体【   
这东西不太好说.具体情况具体考虑.我给你一个例子.希望你可以从中得到思路



<form id="form1" name="form1" method="post" action="">
<input type="text" name="start" />

<input type="text" name="end" />
<input type="submit" name="Submit" value="提交" />
<input type="reset" name="Submit2" value="重置" />
</form>
<?php
/*
*心若水寒
*http://www.phpfans.net/
*/
if(isset($_POST['Submit'])){
$conn = mysql_connect("localhost","root","");
mysql_query("set names 'gbk'");
mysql_select_db("caiji2");
for($i=$_POST['start'];$i<=$_POST['end'];$i++){
$url = "http://www.phper.com/html/php-mysql/".$i.".html";
@$fp = fopen($url,'r');
if(!$fp) continue;

$buffer = '';
while(@!feof($fp)){
$buffer .= @fread($fp,1024);
}
preg_match_all("/<h1>(.+?)</h1>/is",$buffer,$title);
$title[0][0] = preg_replace("/<h1>(.+?)</h1>/is","1",$title[0][0]);
$title = explode("——",$title[0][0]);
$ar_subject = $title[0];
//echo $ar_subject;exit;

preg_match_all("/<div class="content">(.+?)</div>/s",$buffer,$array);
//echo $array[0][0];exit;
//preg_match_all("/(.+)<br>/is",$array[0][0],$array);
//$array[0][0] = str_replace("&lt;","<",$array[0][0]);CnPhper.com By Cnphper CnPhperFrom CnPhper.com
//$array[0][0] = str_replace("&gt;",">",$array[0][0]);
//$array[0][0] = htmlspecialchars($array[0][0]);
//$array[0][0] = str_replace("<BR>","n",$array[0][0]);
//$array[0][0] = str_replace(" "," ",$array[0][0]);
$ar_content = strip_tags($array[0][0],"<br>");
//$ar_content = str_replace("From CnPhper.com","",$ar_content);
//$ar_content = preg_replace("/CnPhper.com/i","",$ar_content);

//echo $ar_content;exit;
//$ar_content = substr($array[0][0],14,-6);
$sql = "insert into cdb_article values(null,'未知','".addslashes($ar_subject)."','".addslashes($ar_content)."','互联网','2006-07-20',0,4,0,1,0)";
mysql_query($sql,$conn);
fclose($fp);
}
}
?>
娱乐休闲专区A 影视预告B 音乐咖啡C 英语阶梯D 生活百科
网页编程专区E AMPZF HTMLG CSSH JSI ASPJ PHPK JSPL MySQLM AJAX
Linux技术区 N 系统管理O 服务器架设P 网络/硬件Q 编程序开发R 内核/嵌入
管理中心专区S 发布网址T 版主议事U 事务处理