chinayilin
(chinayilin)
注册会员

中级会员
UID 12301
精华
0
积分 144
帖子 138
金钱 144 喜悦币
威望 0
人脉 0
阅读权限 20
注册 2002-1-18 来自 郑州
状态 离线
|
再次请教关于小偷程序[信息采集]的问题
各位老村民前辈,小弟在这里先谢过了。
我在01年使用php编程,后来工作变动,到学校教书了,php荒废很久,现在遇到一个棘手的问题,肯请大家帮忙
现在为增加图书信息,需要到这个网站www.douban.com 豆瓣网 获得一些图书的信息,不知道该怎么办,希望大家能帮我,非常感激
我01年做过新浪新闻首页新闻小偷,思路是读取目标页面代码,然后分析特征,截取有用的字符串入库,现在对于豆瓣网这样的网站不知道该如何做,
首先,它每本书在网站上都是一个目录名字如http://www.douban.com/subject/1968643/,可是数字和书本都在一起,有的是碟子,有的是书,不知道怎么处理,
希望大家能给我一些帮助,这个问题已经困扰我很久了,
最后还要再次谢谢大家。
|
|