YZHForce
新手上路

UID 70416
精华
0
积分 5
帖子 6
金钱 5 喜悦币
威望 0
人脉 0
阅读权限 10
注册 2006-3-27
状态 离线
|
最新最全的PHP汉字转拼音库 按照金山词霸2005的《国际标准汉字大字典》制作的
最新最全的PHP汉字转拼音库,按照金山词霸2005的《国际标准汉字大字典》制作的。
最近无聊便研究了一下PHP如何实现汉字转拼音。发现网上提供的拼音库自己都不怎么满意,要么就是GB2312的拼音库,要么就是用《微软输入法生成器》转换,前者只支持几千个汉字远远不够用,后者还算好支持全部的GBK汉字,但是问题也很多,比如没有声调、且很多字的字音是错的。
后来在网上无意中找到了个金山词霸的字典dump工具,于是便做了这个拼音库。
有意思的是《国际标准汉字大字典》里比通过《微软输入法生成器》做逆转换少了一个“龥”字。
GBK编码,总共20901个汉字,多音字支持,声调支持。
example.zip 中是例子程序,可以对整句中文拆字再转成拼音(对多音字生成所有可能的读音情况)。
pinyin_table_ISCCD_no_tune.zip 没有声调的转换表
pinyin_table_ISCCD_with_tune.zip 有声调的转换表
table_ISCCD.rar 文本格式的拼音表,可以用作其它语言。
附件: 您所在的用户组无法下载或查看附件
|
|