太原理工大学
硕士学位论文
基于数据挖掘技术的智能答疑系统的研究与设计
姓名:闫冬冬
申请学位级别:硕士
专业:计算机应用技术
指导教师:闫宏印
20100401
太原理工大学硕士研究生学位论文
基于数据挖掘技术的智能答疑系统的研究与设计
摘要
数据挖掘是从大型数据集中,挖掘隐含在其中的、人们事先不知道的、
对决策有用的知识的过程。通过对数据的统计、分析、综合和推理,发现
数据间的关联性、未来趋势以及一般性的概括知识等,这些知识性的信息
可以用来指导高级商务活动。
答疑、解惑不仅是课堂教学中的一个必不可少的环节,同时也是网络
教学中的一个重要模块。智能答疑系统的研究主要是致力于改革现有的答
疑模式, 充分利用教育网中知识库的资源, 通过机器处理, 自动回答学生的
问题, 从而实现教育中答疑这一重要的教学环节, 提高教学效率和教学质
量。
本文分析了现有的答疑系统,研究并实现了一个带有论坛功能的基于
web的智能答疑系统。系统实现了用户的注册、登录、提问和获取答案,同
时通过论坛完成用户对问题的的异步答疑,让用户拥有更广阔的探讨平台。
另外,本文将数据挖掘技术应用于智能答疑系统后台中,提出了一种基于
数据挖掘算法的自动答疑设计方案,目标是实现一个快速准确高效的智能
答疑系统。该方案的基本思想是将基于关键词的关联规则应用于文档的相
似度计算当中,从每个问题所对应的诸多答案中抽取出一个最佳的答案生
成一一对应的问题答案对库,然后执行基于关联规则的文本聚类算法,实
现问题的分类存储。将聚类后的每一类问题应用关联规则,可得到更加准
确的关联表,与此同时也促使相似度的精确度得以提高。通过以上方案便
I
太原理工大学硕士研究生学位论文
可以得到一个分类存储、答案准确度高的数据仓库。最后利用基于关键词
关联度的相似度计算方法进行系统答疑,从而完成了一个答疑准确的智能
答疑系统。
关键词:数据仓库,数据挖掘,关联规则,相关性分析,文本聚类
II
太原理工大学硕士研究生学位论文
RESEARCH AND DESIGN ON DATA MINING IN
INTELLIGENT QUESTION ANSWERING SYSTEM
ABSTRACT
Data mining is the process of abstracting unaware, potential and useful
information and knowledge from plentiful, plete, noisy, fuzzy and
stochastic data. By statistics , analysis, synthesis and reasoning the dates it finds
out the correlation of dates, the future trend and general knowledge and so on
which are used to guide senior businesses.
Question and answering is not only a process of classroom teaching but
also an important module of web-based QA system working for
making full use of the resource of knowledge base in the to
realize question answering and improve the quality and efficiency of the
teaching.
The paper analyzes the existing question-answering system, studies and
implements an intelligent question-answering system based on web with a BBS
functions. The question-answering system implements the user registration、
login、question and answer, and pletes the user asynchronous clarification
through the BBS and let users have a wider ran
基于数据挖掘技术的智能答疑系统的研究与设计 来自淘豆网www.taodocs.com转载请标明出处.