下载此文档

大数据与机器学习构建动态企业级画像系统论文.pdf


文档分类:IT计算机 | 页数:约3页 举报非法文档有奖
1/3
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/3 下载此文档
文档列表 文档介绍
科技风 2021 年 5 月 电子信息
DOI: /-
大数据与机器学****构建动态企业级画像系统
房金龙
北京对外经济贸易大学统计学 北京 1 00000
摘 要:目前市场上有不少基于 B2C 业务的客户画像的系统以及方法论,而针对 B2B 业务的企业级的画像系统和相应的
技术却相对比较缺乏,因此,在借鉴了 B2C 客户画像方法论的基础上,利用大数据与机器学****去构建一个动态的企业级的画
像系统是这整篇论文的主旨。 在构建企业画像的过程中,一方面通过网络爬虫获取实时的海量的企业数据,来实现数据采集
上的实时性和多维度性;而在应用场景处理的问题上,通过使用自然语言处理对文本数据建模来自动化处理大量的文本信
息,完成海量文本的分类和标签化处理,从而最终实现动态企业级的画像系统。
关键词:网络爬虫;自然语言处理;动态企业画像
1 绪论 判定;企业健康指数需要通过公司招聘信息、申请专利数、盈
企业级画像系统是以企业为主体,通过对企业规模、经 利状况等数据进行计算;公司主营业务变更以及最新舆情可
营范围、公司人数、注册资本、财务状况、招聘状态、最新业务 以通过公司在新闻网站发布的官方新闻获取。
动态等信 息 进 行 采 集 和 分 析, 构 建 出 不 同 标 签 的 企 业 画 (3)爬虫技术。 针对网络爬虫的工具有很多,由于 Python
像[1] 。 企业画像的内容可以根据具体的应用场景进行定制 语言优美,代码简单,模块功能强大,现已成为数据挖掘、机器
化设定。 企业画像的标签可以是一个公司的发展阶段( 初 学****人工智能首选编程语言。 其中 Python Scrapy 网

大数据与机器学习构建动态企业级画像系统论文 来自淘豆网www.taodocs.com转载请标明出处.

非法内容举报中心
文档信息
  • 页数3
  • 收藏数0 收藏
  • 顶次数0
  • 上传人好用的文档
  • 文件大小2.28 MB
  • 时间2021-07-27