华中科技大学
硕士学位论文
异体字字库开发研究--以《第一批异体字整理表》为依据
姓名:李丹
申请学位级别:硕士
专业:语言学及应用语言学
指导教师:黄仁瑄
2011-01
华中科技大学硕士学位论文
摘要
异体字字库的开发问题一直困扰着我们,因为它牵涉到了异体字的数字化问题,
异体字的整理问题,和字库的开发平台研究。本文以《第一批异体字整理表》为依
据,对于学术界争论已久的异体字定义问题即采取狭义异体字还是广义异体字提出
了基于整理层面的异体字研究和基于应用的层面的异体字研究,把《第一批异体字
整理表》和《汉语大字典》、《康熙字典》、《说文解字》进行了对比研究,整理出了
音义完全相同的异体字。在字库的开发中,我们采用了尉迟治平先生“字形”和“字
位”的概念,遵守了国际 Unicode 组织一形一码的编码原则,试着探讨了异体字字
库建设的相关问题。
绪论部分主要介绍了异体字的整理和字库的开发现状以及本文的研究材料和研
究方法。
第二章主要从输入法的发展,字符集的不断扩大和数据库的发展三个方面介绍
了数字化汉字字库的必要性和可能性。
第三章先讨论了异体字的定义问题,了解了在异体字定义中最大的分歧是采取
广义异体字和狭义异体字,然后我们通过观察一系列异体字整理表如《第一批异体
字整理表》、《汉语大字典·异体字表》、《通用规范汉字表》,对它们在整理异体字的
过程中所遵循的原则进行了解,深入的发掘了异体字整理中遇到的问题以及解决的
办法,提出了整理狭义异体字的定义,即基于整理的一组狭义异体字是音义完全相
同,而且不包括繁简字和姓氏字。
第四章根据前两章的讨论,得到了基于整理层面的异体字字库开发,和基于应
用层面的异体字库开发的观点,并以《第一批异体字整理表》为例,对它所收的异
体字以组为单位进行了对比研究,对它所收的异体字进行了细致的描写和归类,并
对归纳出来的音义完全相同的异体字试着进行了字库建设。
最后是结语部分,归纳了全文的重点是提供一种可行的思路即基于不同层面的
异体字整理办法。对异体字现象中的狭义异体字进行了整理,并试着为狭义异体字
的字库建设做了介绍。
关键字:《第一批异体字整理表》数字化异体字字形字位
I
华中科技大学硕士学位论文
Abstract
The development of Variant character issues are still with us, Because it involves
digital of variant Character issues,Sorting out variant character problems, and character
development platform. In this paper, "the first batch of Chinese Variants, Character " as
the basis, For the munity has long been debated in the variant that is to take
a narrow definition of the generalized variant or variant level was proposed based on
finishing research and application-based variant of the variant forms of the level, The
"first batch of Chinese Character Variants" and "Chinese Dictionary", "Kang Xi
Dictionary", "Dictionary " parative study, sorting out the sound and meaning exactly
the same variant. In the character's development, we used Mr. YuChi "shape" and
"word-bit" concept, ply with the anizations of a Unicode encoding
form of the principle of a yard, try a variant of issues related to character building.
The first chapter from the input method development, expandin
异体字字库开发研究--以《第一批异体字整理表》为依据 来自淘豆网www.taodocs.com转载请标明出处.