下载此文档

《信息计量第七章》.ppt


文档分类:经济/贸易/财会 | 页数:约93页 举报非法文档有奖
1/93
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/93 下载此文档
文档列表 文档介绍
该【《信息计量第七章》 】是由【相惜】上传分享,文档一共【93】页,该文档可以免费在线阅读,需要了解更多关于【《信息计量第七章》 】的内容,可以使用淘豆网的站内搜索功能,选择自己适合的文档,以下文字是截取该文章内的部分文字,如需要获得完整电子版,请下载此文档到您的设备,方便您编辑和打印。(1902-1950)美国哈夫大学著名语言学家和心理学家。1929年?相对频率:语音变化的决定性因素?1948年?人类行为与最省力法那么-人类生态学引论?*1整理ppt教学要求了解词频统计的产生和开展了解Booth定律掌握Zipf定律的表述、数学模型及图像特征熟悉词频分布原理熟悉Zipf定律应用中的根本技术和方法Date2整理ppt主要教学内容§1词频统计的产生和开展§2Zipf定律的表示**§3Zipf第二定律§4词频分布原理*§5Zipf定律的应用*Date3整理ppt第一节词频统计的产生和开展一、几个根本概念1、词频〔nr〕:自然语言中某一个单词在文献中或讲话中出现的次数〔频次〕。不同的词汇在同一篇文献中出现频次的分布是不均匀的。2、词汇数〔N〕:文献中出现的不同词的数量。即:文献中作者使用了多少个不同的词。3、词次数〔N‘〕:文献的长度,总词量,包括同一词重复出现的次数。Date4整理ppt二、字(词)典的收录和选择中国最早的词典——?尔雅?(汉代),按词的性质和意义排列,词目91706条、134万多字。?字顺英语难词表?。1928年成书的OxfordEnglishDictionary目前最新版本为20卷本第二版,收词超过50万条,引证例句250万条,几乎囊括了1150年以来见于文献的所有语词。Date5整理ppt?汉语大词典?〔上海辞书出版社,1986年〕共12卷,收词37万以上。〔一〕文献中对词的利用?汉语大字典?〔四川辞书出版社,1986年〕全四卷,收录单字约56000多个。Date6整理ppt?***选集?〔四卷合订本,1967年〕总词量约66万,收录2775个汉字。〔一〕文献中对词的利用Date7整理ppt汉字中,目前人们使用的汉字约有15000个。〔一〕文献中对词的利用Date8整理ppt国家文字改革委员会〔语言文字工作委员会〕统计:掌握2851个汉字可以满足99%的阅读需要;%的阅读需要。〔一〕文献中对词的利用Date9整理ppt1981年的?通讯用汉字字符集〔根本集〕及其交换码标准?〔GB2312-80〕中确认“汉字根本字符〞为6763个。其中,一级汉字3755个,二级汉字3008个。〔一〕文献中对词的利用Date10整理ppt

《信息计量第七章》 来自淘豆网www.taodocs.com转载请标明出处.

相关文档 更多>>
非法内容举报中心
文档信息
  • 页数93
  • 收藏数0 收藏
  • 顶次数0
  • 上传人相惜
  • 文件大小5.68 MB
  • 时间2024-04-17