喜悦国际村 
» 游客:  注册 | 登录 | 搜索 | 统计 | 喜悦证交所 | 帮助

RSS 订阅当前论坛  

[北京]代朋友公司招聘PHP高级程序员多名

上一主题 下一主题
     
标题: [问题] php使用curl采集的问题  
 
kfg
新手上路
Rank: 1
初级会员



UID 68214
精华 0
积分 16
帖子 15
金钱 16 喜悦币
威望 0
人脉 0
阅读权限 10
注册 2006-1-21
状态 离线
php使用curl采集的问题

我采集一个新闻列表,用下面的函数:
        function get_contents($url){
                $ch = curl_init();     
                curl_setopt ($ch, CURLOPT_URL, $url);     
                curl_setopt ($ch, CURLOPT_RETURNTRANSFER, 1);
                curl_setopt ($ch, CURLOPT_TIMEOUT, 1000);
                $file_contents = curl_exec($ch);     
                curl_close($ch);
                return $file_contents;
        }

页面是这样的,一个页面列表,列表里面有100个连接,我首先获取100个连接,然后再根据这些连接去获取连接页面的内容,但是会出现每隔10个连接就有一个内容获取不到,而且每次采集缺失的页面都不同。
这100个连接都能用正则表达式取出,但是用get_contents()这个函数取获取的时候,就会出现上面说的问题,而用ie直接访问这些连接又是正常的。
同一个函数,采集某个连接没问题,但是采集另外的连接就出问题;同一个函数,同一个连接,这个时间采集出问题,另一个时间采集却没问题。。
郁闷阿~~都不知道问题出在哪里,麻烦各位指点一下,谢谢了。
2008-2-12 04:04 PM#1
查看资料  发短消息  顶部
 
uuq
高级会员
Rank: 4
中级会员


UID 28149
精华 1
积分 821
帖子 859
金钱 811 喜悦币
威望 10
人脉 0
阅读权限 50
注册 2004-4-27
来自 广州
状态 离线
[推荐阅读] 我来发一个新纪元的帖子
看看是不是要发送什么表头之类
2008-2-13 01:35 PM#2
查看资料  发短消息  顶部
 
kfg
新手上路
Rank: 1
初级会员



UID 68214
精华 0
积分 16
帖子 15
金钱 16 喜悦币
威望 0
人脉 0
阅读权限 10
注册 2006-1-21
状态 离线
[推荐阅读] 名副其实的猪年最后一贴
不需要发送任何数据给对方服务器的,而且每个连接的页面结构是一模一样的。
2008-2-13 05:37 PM#3
查看资料  发短消息  顶部
     


  可打印版本 | 推荐给朋友 | 订阅主题 | 收藏主题 | 开通个人空间  


 




Powered by Discuz! 6.1.0  © 2001-2010 Comsenz Inc.
Processed in 0.021729 second(s), 6 queries

(冀ICP备05009913号) 管理员:sadly 邮箱/MSN: sadly@phpx.com QQ:824008(长隐) 清除 Cookies - - Archiver - WAP