喜悦国际村 
» 游客:  注册 | 登录 | 搜索 | 统计 | 帮助

RSS 订阅当前论坛  

喜悦证交所已经关闭

上一主题 下一主题
     
标题: [问题] URL编码的问题.  
 
阿刁
中级会员
Rank: 3Rank: 3
一般会员


UID 31510
精华 0
积分 301
帖子 279
金钱 301 喜悦币
威望 0
人脉 0
阅读权限 30
注册 2004-9-27
状态 离线
[广告]: q m
URL编码的问题.

http://search.live.com/results.aspx?q=%E5%8D%B0%E5%B7%B4%E6%96%87%E5%8C%96&mkt=zh-CN&form=QBRE&lf=1

上面是用Live Search 搜索"印巴文化"时,地址栏出现的网址.


http://www.sogou.com/web?query=%D3%A1%B0%CD%CE%C4%BB%AF
这个用是搜狗搜索"印巴文化"时,地址栏出现的网址.

仔细看可以看出"印巴文化"被转成了两种不同的编码.
运行下面的代码可以得到搜索结果页面.

<?php
$file 
file_get_contents("http://www.sogou.com/web?query=印巴文化); 
    print_r($file);
?>
但如果换成下面这个就不行了.

<?php
$file 
file_get_contents("http://search.live.com/results.aspx?q=印巴文化&mkt=zh-CN&form=QBRE&lf=1"); 
    
print_r($file);
?>
请教如何才能用PHP得到结果页的原代码.?




印巴文化
2007-3-1 07:41 PM#1
查看资料  Blog  发短消息  QQ  顶部
 
kuco
高级会员
Rank: 4
一半会员


UID 66126
精华 0
积分 962
帖子 964
金钱 909 喜悦币
威望 0
人脉 53
阅读权限 50
注册 2005-8-23
来自 上海
状态 离线
[推荐阅读] 成都PHP程序员求职
这个是因为页面采用的编码不同造成的.

在 utf-8 网页下  urlencode("印巴文化"); //<-- %E5%8D%B0%E5%B7%B4%E6%96%87%E5%8C%96
在 gb2312 网页下  urlencode("印巴文化"); //<-- %D3%A1%B0%CD%CE%C4%BB%AF




阿里妈妈再掀疯狂采购风,急召天下站长,新加入站点3天内一定采购!
2007-3-1 08:28 PM#2
查看资料  Blog  发短消息  顶部
 
阿刁
中级会员
Rank: 3Rank: 3
一般会员


UID 31510
精华 0
积分 301
帖子 279
金钱 301 喜悦币
威望 0
人脉 0
阅读权限 30
注册 2004-9-27
状态 离线
[推荐阅读] 关于嵌入flash的问题
那么如何才能解决我提到的问题呢?
请教如何才能用PHP得到结果页的原代码.? 谢了




印巴文化
2007-3-2 12:10 PM#3
查看资料  Blog  发短消息  QQ  顶部
 
52php
中级会员
Rank: 3Rank: 3



UID 84572
精华 0
积分 361
帖子 225
金钱 361 喜悦币
威望 0
人脉 0
阅读权限 30
注册 2006-12-10
状态 离线
[推荐阅读] $this->resource这是什么写法?详见贴里
转换编码到统一的格式,不如转到utf-8:

<?php
$ckw
=mb_convert_encoding($kw,'gb2312','utf-8');
?>
当然你也可以用iconv转换
2007-3-2 12:40 PM#4
查看资料  发短消息  顶部
 
没看见 (帅哥杨)
高级会员
Rank: 4
被遗忘的漏洞


UID 67293
精华 0
积分 852
帖子 888
金钱 852 喜悦币
威望 0
人脉 0
阅读权限 50
注册 2005-12-19
状态 离线
[推荐阅读] 2000RMB网站项目
as save时有编码选择,还有检查meta和header



某年某月某日某时某分某秒某人在路边摔了一跤

Meiysi Club
http://www.meiysi.com/
2007-3-2 01:12 PM#5
查看资料  Blog  发短消息  QQ  顶部
 
阿刁
中级会员
Rank: 3Rank: 3
一般会员


UID 31510
精华 0
积分 301
帖子 279
金钱 301 喜悦币
威望 0
人脉 0
阅读权限 30
注册 2004-9-27
状态 离线
[推荐阅读] 苏州工业园区影元设计诚聘PHP开发
<?php
$file = file_get_contents("http://search.live.com/results.aspx?q=印巴文化&mkt=zh-CN&form=QBRE&lf=1");
    print_r($file);
?>
运行代码出来的是乱码,谁能搞定这个乱码问题?




印巴文化
2007-3-2 04:48 PM#6
查看资料  Blog  发短消息  QQ  顶部
 
era
高级会员
Rank: 4


UID 84851
精华 0
积分 567
帖子 749
金钱 567 喜悦币
威望 0
人脉 0
阅读权限 50
注册 2006-12-15
状态 离线
[推荐阅读] 文件缓存sql语句安全吗???
<meta http-equiv="content-type" content="text/html; charset=utf-8" />

作为一个程序员,不应该说出乱码这两个字




怀念我的家乡-火星
2007-3-2 05:07 PM#7
查看资料  发短消息  顶部
 
阿刁
中级会员
Rank: 3Rank: 3
一般会员


UID 31510
精华 0
积分 301
帖子 279
金钱 301 喜悦币
威望 0
人脉 0
阅读权限 30
注册 2004-9-27
状态 离线
[推荐阅读] 小弟求职php程序员.
<meta http-equiv="content-type" content="text/html; charset=utf-8" />
<?php
$file = file_get_contents("http://search.live.com/results.aspx?q=印巴文化&mkt=zh-CN&form=QBRE&lf=1");
print_r($file);
?>

这样还是乱码




印巴文化
2007-3-2 05:51 PM#8
查看资料  Blog  发短消息  QQ  顶部
 
era
高级会员
Rank: 4


UID 84851
精华 0
积分 567
帖子 749
金钱 567 喜悦币
威望 0
人脉 0
阅读权限 50
注册 2006-12-15
状态 离线
[推荐阅读] 值得讨论的函数


if (!function_exists('iconv')){
        die("加载你的iconv模块");
} else {
        $file = file_get_contents("http://search.live.com/results.aspx?q=".urlencode(iconv("GBK","UTF-8","印巴文化"))."&mkt=zh-CN&form=QBRE&lf=1");
        if (preg_match("/<meta\s+http\-equiv=\"content\-type\"\s+content=\"text\/html;\s*charset=utf\-8\"\s*\/>/is",$file)){
                $file = preg_replace("/(<meta\s+http\-equiv=\"content\-type\"\s+content=\"text\/html;\s*charset=)(utf\-8)(\".*?\/>)/is","\\1GBK\\3",$file);
                print preg_replace("/([\x7f-\xff]+\W+)/e","iconv(\"UTF-8\",\"GBK\",\"$1\")",$file);
        } else {
                print $file;
        }
}
也不多说你了




怀念我的家乡-火星
2007-3-2 07:29 PM#9
查看资料  发短消息  顶部
     


  可打印版本 | 推荐给朋友 | 订阅主题 | 收藏主题 | 开通个人空间  


 




Powered by Discuz! 6.1.0  © 2001-2010 Comsenz Inc.
Processed in 0.024730 second(s), 6 queries

(冀ICP备05009913号) 管理员:sadly 邮箱/MSN: sadly@phpx.com QQ:824008(长隐) 清除 Cookies - - Archiver - WAP