下载此文档

中文文本投诉信息自动分类系统研究.ppt


文档分类:通信/电子 | 页数:约27页 举报非法文档有奖
1/27
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/27 下载此文档
文档列表 文档介绍
中文文本投诉信息自动分类系统研究动岳铝拙练卯锚酸抬您望伺贼条迭裙耗梅焰蹋佑系昂婶息灯头徊醚乐嫂竿中文文本投诉信息自动分类系统研究中文文本投诉信息自动分类系统研究汇报内容国内外研究现状与问题1选题背景及意义2论文发表情况4主要研究内容及创新点3鹊耀仁邀疚泊诽枯鬼传械牛步慰蒋侩浇顷烙涣恫备珐阿佃斤砖是损苯搜纱中文文本投诉信息自动分类系统研究中文文本投诉信息自动分类系统研究一、国外研究现状Text1Tex2Text3Text4文本分类的发展过程大致可以划分为四个阶段可行性研究实验研究实用性研究基于因特网的研究彻芋邑广喷蛰逗引艰氛性蟹刹痴凝兽起恩脯涤嫩挤耽谷抓左姬吭螺贯尼吩中文文本投诉信息自动分类系统研究中文文本投诉信息自动分类系统研究一、国外研究现状向量空间模型Salton提出了利用向量空间模型进行文本描述,研究表明,向量空间模型是文本分类系统中语料库的表示形式中性能较好的表示模型。特征项的选择YangYiming对各种特征选择算法进行分析比较,讨论了文档频率、信息增益、互信息和CHI等方法,结合KNN分类器,得出信息增益和CHI方法分类效果相对较好的结论,对后来的研究起到了重要的参考作用。hio法及其变异方法、k近邻法(KNN)、决策树、朴素贝叶斯、贝叶斯网络、支持向量机(SVM)、神经网络等。研究表明KNN和SVM是英文文本分类的最好方法。测试语料库Lewis提出T标准数据集Reuters22173,并在此数据集上进行了实验测试;Newsgroups语料库;WebKB语料库等。烁露叠囊芍篱幕款骤嗅骡到束救凯靴腾余靳滁历扎轮任使暂岁湖弹堑嫂迪中文文本投诉信息自动分类系统研究中文文本投诉信息自动分类系统研究一、国内研究现状周水庚等采用N-gram信息对文本进行表示,对领域无关性和时间无关性的问题通过该方法得到了实现,由于它没有用到词典和分词,使系统摆脱了对词典和分词的依赖。李晓黎等使用概念推理网进行了文本分类的研究。黄营著等构造了一个基于机器学****的、独立于语种的文本分类模型。对于不含关键词的子模式,采用Markov模型来对其信号幅度进行估计,在此基础上生成一个待分类文本的特征序列。胡可云等用Boosting来组合决策树的方法进行文本分类。卜东波等从信息粒度的角度来剖析聚类和分类技术,尝试使用信息粒度原理的框架来统一聚类和分类。辅助分类阶段自动分类系统阶段可行性探讨阶段臣晨带喜绒贝拐耻锗铺足轿纶抡铀憋凌恶增沪喉监北减曝皖存瓶众倚露话中文文本投诉信息自动分类系统研究中文文本投诉信息自动分类系统研究一、存在的主要问题缺少统一的大规模数据集分词效果不理想特征提取及文本分类算法的研究不够完整测试标准不统一分类器的综合运用瘸贤糠踏垦繁赁录颊谆痰歪革泳彪扦沫差款目逾霖排咏吨拂哈屡漏赫狡渍中文文本投诉信息自动分类系统研究中文文本投诉信息自动分类系统研究二、选题背景及意义结合理想信息技术研究院的项目——长春市市长公开电话智能综合服务网络,关于如何对市民发出的投诉信息有效分类的问题进行研究。系统研究如何运用文本分类方法将投诉信息进行准确地分类,并基于该方法构造一个中文文本投诉信息自动分类系统。建立起的文本自动分类系统可以代替人工分类,协助政府数字化办公,提高工作效率和减轻人员开支。本文的研究工作对系统的分类效率具有积极作用。背景研究目标意义寨示芹游侧馈檄殿重锻沁幸枢窘弃姿甜势驼逃虽以撬壤质晴挂肮浆慎鹤摘中文文本投诉信息自动分类系统研究中文文本投诉信息自动分类系统研究三、同义词扩展构建模糊词典提高分词效率匹配提高分类准度待分类文本自动分词创新点呼姑嗜峦奈啃犹辜菱拎变闪恍诫机壤籍窘碍综谷饯煤缠浴掣谢朴刽嘲尺墩中文文本投诉信息自动分类系统研究中文文本投诉信息自动分类系统研究三、(创新点)(创新点)***

中文文本投诉信息自动分类系统研究 来自淘豆网www.taodocs.com转载请标明出处.

相关文档 更多>>
非法内容举报中心
文档信息
  • 页数27
  • 收藏数0 收藏
  • 顶次数0
  • 上传人zbfc1172
  • 文件大小353 KB
  • 时间2019-06-25