喜悦国际村 
» 游客:  注册 | 登录 | 搜索 | 统计 | 帮助

RSS 订阅当前论坛  

喜悦证交所已经关闭

上一主题 下一主题
     
标题: [问题] 问一个关于socket头部的问题  
 
mysll
新手上路
Rank: 1



UID 88167
精华 0
积分 35
帖子 23
金钱 35 喜悦币
威望 0
人脉 0
阅读权限 10
注册 2007-2-8
状态 离线
问一个关于socket头部的问题

我现在正在做一个rss聚合的东东,现在要从一个博客主页中提取出它的rss地址,我的做法是先把博客主页源码抓取下来,取出所有的链接。
再打开每个链接。考虑到取出每个页的内容太多,所以我用socket取出每个页面的部分内容
在socket发送的头部用了Range:bytes=0-1024,取出前1024个字节,然后在这1024个字节里打<rss标志,如果有这个标志,代表这是一个rss文件。
测试了十二个博客,有二个博客取不出来,MSN的还有一个其它的,我用sniff截了个头看了一个,发现它的头部很大,我现在的问题是:Range的范围包括head的长度吗,我取1024,会不会没有取到正文的内容?
2007-5-7 11:01 AM#1
查看资料  发短消息  顶部
 
mysll
新手上路
Rank: 1



UID 88167
精华 0
积分 35
帖子 23
金钱 35 喜悦币
威望 0
人脉 0
阅读权限 10
注册 2007-2-8
状态 离线
[推荐阅读] c语言如何直接调用php的dll文件?
高手快帮我看看啊,项目快要公测了。我急啊~~~~~
2007-5-7 11:08 AM#2
查看资料  发短消息  顶部
 
phphp
版主
Rank: 7Rank: 7Rank: 7
加班一族


UID 65188
精华 1
积分 184
帖子 3007
金钱 173 喜悦币
威望 10
人脉 1
阅读权限 100
注册 2005-7-20
来自 北京市海淀区
状态 离线
[推荐阅读] 数据库乱码问题?急求解
echo ss



书到用时方恨少, 事非经过不知难
2007-5-7 02:24 PM#3
查看资料  访问主页  Blog  发短消息  QQ . .   顶部
     


  可打印版本 | 推荐给朋友 | 订阅主题 | 收藏主题 | 开通个人空间  


 




Powered by Discuz! 6.1.0  © 2001-2010 Comsenz Inc.
Processed in 0.021580 second(s), 6 queries

(冀ICP备05009913号) 管理员:sadly 邮箱/MSN: sadly@phpx.com QQ:824008(长隐) 清除 Cookies - - Archiver - WAP