目录
一、项目背景与目标
1.CJK汉字统一编码的补充
2.中文汉字教学的辅助
3.中文信息技术开发的基础项目
二、对比对象与对比分析流程
1.对比对象
2.对比分析流程
三、字汇对比一覆盖率统计及其频率权重
1.覆盖率
2.cY/HsK覆盖/未覆盖各国家/地区字集诸区域在中国大陆现代报刊语料中的频率权重测算(数据表)
3.HsK覆盖/未覆盖区域在中国大陆现代报刊语料中的频率权重图(交叉对比)
四、字形对比一字形异同统计及诸子集频率权重
1.J—J’、K—K’、T—T’、H—H’的字形异同统计及其在中国大陆现代语料中的频率权重(数据表)
2.各国家/地区之同形/微差/简化诸子集汉字比例(饼图)
3.各国家/地区之同形/微差/简化诸子集汉字比例及权重贡献率(柱形图)
4.各国家/地区之同形/微差/简化诸子集权重贡献率相对于子集大小比例的指数(柱形图)
五、简化模式的进一步分析
1.香港小学用字H—H’简化异码分析
2.台湾国小用字T—T’简化异码分析
3.日本常用字J—J’简化异码分析
4.韩国常用字K—K’简化异码分析
5.各国家/地区字集简化方式之比例(交叉对比)
6.各国家/地区字集各简化方式之频率权重(交叉对比)
7.各国家/地区字集各简化方式之单字平均权重(交叉对比)
8.两组重要的条件简化的细节
9.大陆~台湾两组条件映射字的频率信息
六、凡例
1.同形同码/微差同码字表(日本除外)
2.简化异码字表(日本除外)
3.同形同码/微差同码字表(中国一日本)
4.简化异码字表(中国一日本)
七、对日韩港台汉字的特别说明
1.关于台湾国小用字
2.关于香港小学用字
3.关于日本常用汉字
4.关于韩国常用汉字
八、本报告的网络版
1.网络版采用B/S体系结构(Browser/Server)
2.查询类别的选择
3.查询范围(子集)的选择
4.待查汉字的输入
5.浏览方式
6.大字显示与动态笔顺
7.察看说明与覆盖率统计、字形异同统计与频率权重等图表
8.新旧字形大字对比图
9.简繁异对照
10.常见简繁错误
11.HSK常用汉字
九、小结
十、技术注释
[注1] 汉字认同的xYz模型
[注2] 关于汉字字形
[注3] 关于“源字集分离原则
[注4] 关于“水平认同”与“垂直认同
[注5] 关于微小形差
[注6] 关于汉字正形
十一、字形分类对照表
1.基于台湾国小用字的大陆一台湾字形对照表
(1)[大陆一台湾] 同形同码字表Y—TV4.0
(2)[大陆一台湾] 微差同码字表z—TV4.O
(3)[大陆一台湾] 简化异码字表x—TV4.O
(4)[大陆一台湾] cY独有字表u—cY—T—Tv4.0
(5)[大陆一台湾] HsK(汉办版)独有字表u—HSK0_Tv4.0
(6)[大陆一台湾] HsK(北语版)独有字表u—HSKl_TV4.0
(7)附:TWTTEHanzi
2.基于香港小学用字的内地一香港字形对照表
(1)[内地一香港]同形同码字表Y—HV4.0
(2)[内地一香港] 微差同码字表z—HV4.0
(3)[内地一香港] 简化异码字表x—HV4.0
(4)[内地一香港]cY独有字表u—cY—HV4.O
(5)[内地一香港]HsK(汉办版)独有字表u—HsK0一HV4.O
(6)[内地一香港]HsK(北语版)独有字表u—HsKl_HV4.0
3.基于日本常用汉字的中一日汉字字形对照表
(1)[中一日] 同形同码字表Y—JV4.O
(2)[中一日] 微差同码字表z—JV4.0
(3)[中一日] 简化异码字表x—JV4.0
(4)[中一日] HsK(汉办版)独有字表u—HsKO—JV4.0
(5)[中一日] HsK(北语版)独有字表u—HsKl-JV4.O
4.基于韩国常用汉字的中一韩汉字字形对照表
(1)[中一韩]同形同码字表Y—KV4.0
(2)[中一韩]微差同码字表z—KV4.0
(3)[中一韩]简化异码字表x—KV4.O
(4)[中一韩]HsK(汉办版)独有字表u—HsK0一KV4.O
(5)[中一韩]HsK(北语版)独有字表u—HsKl_KV4.0
(6)附:PronunciationVariantsfromKSX1001:1998
(7)附:ISO/IEC10646Table130一RowF9:CJKCompatibilit
Ideographs
十二、附:原字表(Unicode标注)
1.现代汉语常用字表
2.汉语水平考试用字(汉办版)
3.汉语水平考试用字(北语版)
4.香港小学用字一览表
5.台湾国小用字
6.日本常用汉字表
7.韩国科学和技术教育部指定汉字
后记
后记
2008年5月8日,教育部语言文字信息管理司主持召开了《中日韩常用汉字对比分析》项目专家鉴定会。该项目获得了来自北京大学、北京师范大学和商务印书馆等教育界和出版界专家的高度好评。“专家组充分肯定了该项目选题的重要性,一致认为该项目适应社会迫切需求,对中文信息处理技术开发、基础语文教学、对外汉语教学、国际标准字符集的应用以及辞书编纂等,都具有很高的参考价值”。专家们认定本项目组“充分利用数字化技术,开展中日韩和港台地区的多边合作,取得了具有实用价值的成果”,并建议“纳入《中国语言生活绿皮书》系列发布,早日提供社会应用”。
同时,鉴定组专家也提出了一些宝贵的意见和建议。根据这些建议,本项目组经过一个多月的努力,利用书同文公司的数字化资源进一步开发完善,完成了从’V3.0版到V4.0版的大规模更新。V4.0版的主要特点是:
1.明确了以国家语言文字工作委员会与国家教育委员会于1988年1月26日联合发布的《现代汉语常用字表》(3500字)为分析对比的基础字表,而不是V3.30版之前的“小学用字表”。
2.采用国家汉语水平考试委员会办公室考试中心制定、经济科学出版社2001年6月出版的《汉语水平词汇与汉字等级大纲》(修订本)中“汉字等级大纲”(2905字)的HSK权威字表,同时也保留了北京语言大学版的。HSK字表信息。
3.对所有对比对象,进一步考证并注明了它们的发布单位、版本和出版时间。
4.进一步对各个对比字集进行了等级标注、字汇覆盖关系分类和子集分割。
5.进一步细分、标注并统计了“简化异码”中的“简化、正形、代换”等各种简化模式。
· · · · · · (
收起)