出版时间:2008-7 出版社:商务印书馆 作者:北京书同文数字化技术有限公司 编 页数:416
Tag标签:无
内容概要
本书的编写源于五年前书同文公司向国家语委申请的古籍汉字信息处理攻关研究成果。该成果以ISO/IEC 10646 CJK标准与《康熙字典》字头建立一一对应作为字频统计的基础纲目,以《文渊阁四库全书》和《四部丛刊》全文数码数据作为统计对象(超过八亿古籍汉字语料),最终得出每个汉字的字频排序、出现次数、出现频率,同时也揭示了中文古籍汉字用字量、用字临界点等奥秘,使过去一直模糊不清的技术和应用参数得到明确的验证。 该书的成书发行将为海内外古籍出版业者、中文数字化工程、中文信息处理工作者提供强有力的帮助以及权威性的理论和实用性依据。
书籍目录
1.前言2.凡例3.大规模古籍汉字用字统计报告4.古籍字频统计表5.古籍字频统计表索引6.附录A:《四库全书》电子版工程“保真原则”说明7.附录B (1)样张说明 (2)ISO/IEC 10646:2003 CJK汉字与《康熙字典》关联表说明 (3)ISO/IEC 10646:2003 CJK汉字与《康熙字典》关联表页码·字位序说明 (4)ISO/IEc 10646:2003 CJK汉字与《康熙字典》关联表重复字表说明
图书封面
图书标签Tags
无
评论、评分、阅读与下载