喜悦国际村 
» 游客:  注册 | 登录 | 搜索 | 统计 | 喜悦证交所 | 帮助

RSS 订阅当前论坛  

招聘PHP开发人员(北京)

上一主题 下一主题
     
标题: [问题] 有抓过起点小说的没  
 
guog
论坛元老
Rank: 8Rank: 8



UID 79936
精华 0
积分 9709
帖子 424
金钱 9709 喜悦币
威望 0
人脉 0
阅读权限 90
注册 2006-9-12
来自 北京
状态 离线
[广告]: Enom域名自助付费 自助注册 自助PUSH 主流域名COM等一律57.99元年
有抓过起点小说的没

请教下起点防抓措施怎么样,怕瞎忙活了



没有
2008-7-3 09:24 AM#1
查看资料  Blog  发短消息  顶部
 
游戏人间
版主
Rank: 7Rank: 7Rank: 7
☞风云山庄大少爷☜


UID 62639
精华 2
积分 14538
帖子 7532
金钱 14389 喜悦币
威望 20
人脉 129
阅读权限 100
注册 2004-12-21
来自 广西人在北京
状态 离线
[广告]: Enom域名自助付费 自助注册 自助PUSH 主流域名COM等一律57.99元年
比较难抓,我看到别人抓的都是图片,我的估计是他们手动抓的.



 
群号:6025396/6025252/19520091(广西PHP交流/PHP高级编程/算法交流) 寧可在嘗試中失敗,也不在保守中成功! 不為失敗找理由,只為成功找方法! 饿踢Blog
 
2008-7-3 10:35 AM#2
查看资料  访问主页  Blog  发短消息  顶部
 
guog
论坛元老
Rank: 8Rank: 8



UID 79936
精华 0
积分 9709
帖子 424
金钱 9709 喜悦币
威望 0
人脉 0
阅读权限 90
注册 2006-9-12
来自 北京
状态 离线
[推荐阅读] 想自己创业的过来看看吧!
用curl抓到页面都是乱码,怎么转换都不成,查了下好像是压缩了,请教怎么把抓来的东西用php解压缩?



没有
2008-7-3 11:07 AM#3
查看资料  Blog  发短消息  顶部
 
millken
高级会员
Rank: 4


UID 73040
精华 0
积分 740
帖子 494
金钱 740 喜悦币
威望 0
人脉 0
阅读权限 50
注册 2006-5-9
来自 REFERER
状态 离线
[推荐阅读] 北京公司驻外办事处高薪招聘PHPER3名(3000-8000)
我这样抓没问题啊,起点是GB编码的.

<?php
$content 
file_get_contents('http://www.qidian.com/BookReader/158886,4269766.aspx');
preg_match("'<script src='(.*?.txt)'></script>'si",$content,$txt);
file_put_contents('qidian.txt',file_get_contents($txt[1]));
?>




Blogger 免费搭建的个人BLOG
2008-7-3 01:04 PM#4
查看资料  Blog  发短消息  顶部
 
guog
论坛元老
Rank: 8Rank: 8



UID 79936
精华 0
积分 9709
帖子 424
金钱 9709 喜悦币
威望 0
人脉 0
阅读权限 90
注册 2006-9-12
来自 北京
状态 离线
[推荐阅读] 【北京】业余足球队招募
发现有些页面没问题,有的抓来是乱码,到现在没找到是那出的问题。 转换目标了,不能在一棵树上吊死。
分析一个起点,可以去分析别的三个站了




没有
2008-7-4 09:43 AM#5
查看资料  Blog  发短消息  顶部
 
游戏人间
版主
Rank: 7Rank: 7Rank: 7
☞风云山庄大少爷☜


UID 62639
精华 2
积分 14538
帖子 7532
金钱 14389 喜悦币
威望 20
人脉 129
阅读权限 100
注册 2004-12-21
来自 广西人在北京
状态 离线
[推荐阅读] 低薪找PHPer, 福建泉州(3K起), 走过路过不要错过


QUOTE:
原帖由 guog 于 2008-7-4 09:43 发表
发现有些页面没问题,有的抓来是乱码,到现在没找到是那出的问题。 转换目标了,不能在一棵树上吊死。
分析一个起点,可以去分析别的三个站了
你为什么不去分析那些专抓起点的站呢?

起点用了随机码插到正文内容里了,不好抓.




 
群号:6025396/6025252/19520091(广西PHP交流/PHP高级编程/算法交流) 寧可在嘗試中失敗,也不在保守中成功! 不為失敗找理由,只為成功找方法! 饿踢Blog
 
2008-7-4 10:03 AM#6
查看资料  访问主页  Blog  发短消息  顶部
 
guog
论坛元老
Rank: 8Rank: 8



UID 79936
精华 0
积分 9709
帖子 424
金钱 9709 喜悦币
威望 0
人脉 0
阅读权限 90
注册 2006-9-12
来自 北京
状态 离线
[推荐阅读] 谁知道.bsz文件怎么打开
抓了17k和翠微居的 ,速度不错,40本书几十兆的东西3分钟左右就ok,服务器的处理性能和带宽就是NB



没有
2008-7-4 10:51 AM#7
查看资料  Blog  发短消息  顶部
 
LuckLrj (中国php中的爱因斯坦)
版主
Rank: 7Rank: 7Rank: 7
老会员


UID 64836
精华 0
积分 2323
帖子 3118
金钱 2323 喜悦币
威望 0
人脉 0
阅读权限 100
注册 2005-6-19
状态 离线
[推荐阅读] !!急需php 支付宝支付网关整合高手!!
起点的我研究过,
要转向几次才能登陆。才可以抓。




学习,工作累了,请访问我的小站,娱乐一下。http://www.52sunny.net
2008-7-5 10:21 AM#8
查看资料  Blog  发短消息  顶部
     


  可打印版本 | 推荐给朋友 | 订阅主题 | 收藏主题 | 开通个人空间  


 




Powered by Discuz! 6.1.0  © 2001-2010 Comsenz Inc.
Processed in 0.024069 second(s), 6 queries

(冀ICP备05009913号) 管理员:sadly 邮箱/MSN: sadly@phpx.com QQ:824008(长隐) 清除 Cookies - - Archiver - WAP