简介
主要内容
概述
中的词汇组织关系
词库与查询软件的设计与实施
的应用与发展
与其他理论
一概述
?
发展概况
的心理语言学假设
词汇来源
的对象和关系
的核心概念
?
is a large lexical database of English, developed under the direction of e A. Miller. Nouns, verbs, adjectives and adverbs are grouped into sets of cognitive synonyms (synsets), each expressing a distinct concept. Synsets are interlinked by means of conceptual-semantic and lexical relations. The work of meaningfully related words and concepts can be navigated with the browser. is also freely and publicly available for download. ’s structure makes it a useful tool putational linguistics and natural language processing.
是一个词汇数据库;是一个在线电子词典,它按照语义将众多单词组成一个“词网;是传统的词典信息与现代计算机技术以及心理语言学的研究成果有效结合的产物。
发展概况
1978年,Miller描述了一种“自动化词典”(automated dictionary)的想法。
1985年,真正成为普林斯顿新成立的认知科学实验室几项研究计划中的一个,并开始实际运作。
1986年,Bienkowski用LISP语言写了Grinder的第一个版本。
20世纪70—90年代添加词表并对词进行分类。
1989年年初从一个简单的“词典浏览器”(dictionary browser)发展成一个自足的词汇数据库(self-contained lexical database)。
1991年7月 ,一系列版本发布,。
的心理语言学假设
可分离性假设(Separability hypothesis):语言的词汇成分可以被离析出来并专门针对它加以研究。
可模式化假设(patterning hypothesis):一个人不可能掌握他运用一种语言所需的所有词汇,除非他能够利用词义之间存在的系统的模式和关系。
prehensiveness hypothesis):计算语言学如果希望能像人那样处理自然语言,就需要像人那样储存尽可能多的词汇知识。
词汇来源
语料库Brown语料库;
已有的一些词表Laurence Urdang (1978)的《同义反义小词典》;Urdang(1978)修订的《Rodale同义词词典》;Robert Chapmand(1977)的第4版《罗杰斯同义词词林》;美国海军研究与发展中心的Fred Chang的词表,原有词表只有15%的重合词语(1986)Ralph Grishman和他在纽约大学的同事的一个词表,包含39143个词,LEX词典中。当时词表与该词表重合率为74%(1993年)。
描述的对象
compound(复合词)、phrasal verb(短语动词)、collocation(搭配词)、idiomatic phrase(成语)、word(单词),其中word是最基本的单位。
对象之间的语义关系
同义反义关系(synonymy,antonymy)
上下位关系(hyponymy,hypernym,troponymy)
部分整体关系(entailment,meronymy)
部分句法信息
简单的动词基本句式信息(Verb Sentence Frames)
. beat (somebody ---s somebody)
的对象和关系
的核心概念(synonym set、 lexical matrix)
词汇矩阵概念示意:
F1和F2为同义词;
F2是多义词
:
{board plank}(板)
{mittee}
(委员会)
Glossary(词汇)
Semantic relations
这张表简单说明了词汇矩阵的设想:假定表列代表词形,表行代表词义,矩阵的表项就表示对应列上的词形可以被用来表示相应表行上的词义(在一个适当的上下文环境中)。这样,表项E1,1就表示:词形F1可以表示词义M1。如果同一表列中有两个表项,则该词形具有两个
简介 来自淘豆网www.taodocs.com转载请标明出处.