面向经济普查项目需求的模糊中文地址匹配方法研究 ensusApplication 关键词地理编码;模糊地址;规则库;地址分词;中文自然语言处理;英文关键词geocoding;fuzzyaddress;ruledatabase;Chinesewordsegmentation;Chinesenatuallanguageprocessing;中文摘要地理(地址)编码技术是GIS中的一项基础性技术,它是将自然语言描述的地址信息,通过地址标准化、地址分词、数据库匹配、空间定位等一系列处理操作,赋予其空间位置信息,并最终定位到电子地图上的过程。随着GIS技术的不断发展与推广,越来越多的行业应用中出现了对于地理编码技术的需求,例如公共卫生、犯罪分析、政治科学、灾害管理、交通预测等领域。国外的地理编码技术已经日趋成熟,逐步迈向了市场化、产业化。但是由于国情的不同,国外的现有技术无法直接应用于我国的地理编码需求。因此,针对中文的地理编码技术有待于我们的进一步研究和完善。本文利用北京市的部分经济普查统计数据进行了相关的地址匹配研究,并最终开发实现了面向经济普查的地理编码工具软件。在研究过程中,本文主要针对地理编码技术中的以下几个方面进行了探索与改进:(1)由于目前地址匹配过程中,对于地址残缺与地址歧义两类模糊地址的匹配成功率与准确率偏低,所以本文提出了一种基于规则的地址分词匹配方法,通过对算法的改进,加入规则树与歧义存储等机制,提高了对于这两类模糊地址的匹配成功率。(2)由于传统地址匹配过程中,地址分词与数据库匹配两个步骤相对独立,导致数...英文摘要GeocodingisabasicGIStechnology,whichisaprocessofgivingthespatiallocationinformationtothenaturallanguagedescribedaddressandlocatinginthemapbyaseriesofprocessingoperations,includingaddressstandardization,wordsegmentation, 摘要4-5ABSTRACT5-6目录7-9第一章绪论9-15 -10 -11 -12 -13 -15第二章地理编码关键技术15-20 -16 -18 -19 -20第三章基于规则的中文地址分词匹配方法20-31 -23 -24 -25 -26 -30 -31第四章面向经济普查的地理编码系统设计与实现31-48 -32 -36
面向经济普查项目需求的模糊中文地址匹配方法研究. 来自淘豆网www.taodocs.com转载请标明出处.