Web信息抽取中的文本分类.doc摘要:..摘要在机器学****理论中支持向量机(SVM)有着重要的地位,无论是求解分类问题还是求解回归问题,SVM都有着广泛的应用。本文简单的介绍了SVM的基本原理,讨论了SVM在文本分类中的应用,并详细的分析了如何利用SVM构造文本分类器。这里说明了文本分类的详细处理过程,并介绍了这些过程中的关键技术,如:分词技术、向量空间模型(VSM)、特征选取技术和SVM的交叉验证技术等等。结合着分析和讨论又概略的说明了利用MicrosoftVisualC++,介绍了重要的类和关键处理函数的实现和优化,以及如何利用动态链接库来实现C++到Java的迁移。最后给出了由本系统得到的实验数据和结论。关键字:机器学****文本分类支持向量机(SVM)ABSTRACTABSTRACTSupportVectorMachines(SVM)hasanimportantpositioninMachinelearningtheory,whetheritistosolvetheclassificationproblemorrequestforthereunificationissue,,ashortintroductionintothebasicprinciplesofSVM,adetaileddiscussionoftheSVMinthetextclassification,'sthetextofthedetailedclassificationprocessandintroducedinthecourseofthesekeytechnologies,suchas:segmentationtechnology,vectorspacemodel(VSM),featuresselectiontechnology,cross-++,introducedtherealizationandoptimizationofthekeyclassandimportantfunctions,andhowtouseofdynamiclinklibrarytoachievethemigrationfromC++,:machinelearningtextclassificationSVM(supportvectormachine)目录目录HYPERLINK\l"_Toc201329074"第一章引言 1HYPERLINK\l"_Toc201329075" 1HYPERLINK\l"_Toc201329076" EF_Toc201329076\h1HYPERLINK\l"_Toc201329077" 2HYPERLINK\l"_Toc201329078" 3HYPERLINK\l"_Toc201329079" F_Toc201329079\h4HYPERLINK\l"_Toc201329080"第二章相关理论 6HYPERLINK\l"_Toc201329081" 6HYPERLINK\l"_Toc201329082"(SVM) 7HYPERLINK\l"_Toc201329083" 7HYPERLINK\l"_Toc201329084" 8HYPERLINK\l"_Toc201329085" 10HYPERLINK\l"_Toc201329086" 11HYPERLINK\l"_Toc201329087"第三章需求分析 13HYPERLINK\l"_Toc201329
Web信息抽取中的文本分类 来自淘豆网www.taodocs.com转载请标明出处.