下载此文档

计算机应用于古籍整理研究概况.doc

文档分类：IT计算机 | 页数：约7页举报非法文档有奖

1/7

下载提示

1.该资料是网友上传的，本站提供全文预览，预览什么样，下载就什么样。
2.下载该文档所得收入归上传者、原创者。
3.下载的文档，不会出现我们的网址水印。

同意并开始全文预览

(约 1-6 秒)

1/7 下载此文档

文档列表 文档介绍

计算机应用于古籍整理研究概况
· 2011-06-17 14:11:44

林尔正、林丹红

内容提要从古籍整理手段计算机化和古籍数字化两个方面,介绍借助计算机进行古籍标点、校勘、笺注,古籍数字资料数据库建设和古籍整理计算机辅助研究系统的研究,阐述了古籍知识表示的研究概况。
关键词古籍数字化知识表示古籍整理古籍资料库知识库
中国***的古籍浩如烟海,按初步估计,现存古籍总数至少在10万种以上。这些典籍是中华民族精神与智慧的结晶。然而,古今语言文字差异成为现代人阅读古籍的最大障碍,也使中国传统文化在更广范围的传播受阻。因此,需要古籍工作者们不遗余力地研究、保护和发掘这些宝贵的财富。21世纪信息技术已悄然渗入社会生活的各个领域,高速发展的信息技术赋予古籍整理新的形式及内容。本文从古籍整理手段计算机化和古籍数字化两方面对近几年来古籍整理研究的概貌做个介绍。
1、古籍整理手段计算机化
计算机人工智能技术的发展,使其在古籍整理方面大有用武之地,主要包括标点、校勘、笺注等工作。伴随计算机软件技术的快速发展和人工智能理论的不断完善,利用计算机从事古典文学研究的前景无疑是十分光明的。

计算机不能按人的思维方式,它不是读懂一句话的意思之后再标点。实现计算机进行古籍标点,我们必须把已经标点好的大量文献输入计算机,让计算机分析统计出字与字之间的亲和度,哪些字用作句首,哪些字用作句尾,哪些字永不连用,哪些字组不可分等古汉语规律;再加上如《诗经》、五言诗及成语、人名、地名、职官等众多专用词的数据库,计算机以此作为它学****的基础并生成新的知识库;然后对未加标点的古籍全面扫描切分。于是当这些古籍中每一语句的前后句,都被计算机根据已有数据库的判定原则而断句标点之后,中间字数较少的字组就自然而然成了新的“句”;这个标点的过程本身又是计算机学****的过程,这样就可以不断扩展已有的知识库。以这种建立在计算机能力特点之上并且可以迅速生成和扩展的知识库为根据去标点古籍,不仅其速度人工不能比拟,而且可能比人的经验与知识更为准确。

应用计算机进行校勘,可借助现代技术的发展,选择清晰的底本,通过识别率高的影印软件,排除原书作者或印刷造成的错误。这样拿底本与他本互校,比较其异同,标出参校本与底本的相异之处。从程序设计角度而言,在技术上让计算机比较底本与参校本的异同,并自动生成校记是完全可以实现的。

计算机进行笺注工作需要一个庞大的冷僻字词和典故数据库。计算机在扫描文本时,每当发现有与数据库中的字词相似或相同的情况,则即刻调用该字词的解释并写到程序设定的位置,如该冷僻字词之后或章节、段落之后。我们在读到某篇比较难以理解的文章时,鼠标一点,相关注释即刻出现在文本旁边,即使不能保证100%正确,至少读懂该文章应该没有问题。该工作面临的问题是汉语言的构词特点和文学修辞的丰富多彩,同一个典故会有多种表述方法。在设计这样一个程序时,一要保证冷僻字词和典故数据库尽可能全面,应具有开放性和可扩充性,其次应使用模糊查询方法,遇到非典型性用法,应能够自动判断是否应该予以笺注及调用哪一条数据做出解释。
2、古籍数字化
古籍数字化是古籍整理工作的延伸,是实现古籍整理计算机化的基

计算机应用于古籍整理研究概况来自淘豆网www.taodocs.com转载请标明出处.