下载此文档

基于集群环境的并行频繁子图挖掘算法PG-Miner研究的综述报告.docx


文档分类:IT计算机 | 页数:约2页 举报非法文档有奖
1/2
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/2 下载此文档
文档列表 文档介绍
该【基于集群环境的并行频繁子图挖掘算法PG-Miner研究的综述报告 】是由【niuww】上传分享,文档一共【2】页,该文档可以免费在线阅读,需要了解更多关于【基于集群环境的并行频繁子图挖掘算法PG-Miner研究的综述报告 】的内容,可以使用淘豆网的站内搜索功能,选择自己适合的文档,以下文字是截取该文章内的部分文字,如需要获得完整电子版,请下载此文档到您的设备,方便您编辑和打印。基于集群环境的并行频繁子图挖掘算法PG-Miner研究的综述报告随着云计算、大数据等技术的快速发展,为了提高数据处理的效率和速度,研究人员提出了许多基于集群环境的并行频繁子图挖掘算法,其中PG-Miner是一种非常有效的算法。PG-。其主要思想是通过在集群环境中并行地挖掘频繁子图,从而提高算法的效率和速度。它采用了一种完全分布式的策略,可以在一系列的计算节点上同时处理不同的数据块,最终将结果合并为一个全局结果。相比于传统的单机算法,它在处理大规模数据集时表现更为优异。PG-Miner算法的核心是基于一种称为GSPAN的子图挖掘算法进行改进和扩展。GSPAN算法是一种递归的子图挖掘算法,通过不断地扩展一个候选子图,最终找到频繁的子图。PG-Miner通过将GSPAN算法与并行计算相结合,能够同时处理不同的数据块,最终将结果合并为一个全局结果。在PG-Miner中,为了能够有效地利用计算资源,计算节点之间需要共享计算负载,并通过一些任务分配和数据通信的策略来最小化计算时间。具体来说,PG-Miner算法的实现分为两个阶段。首先,在第一阶段中,PG-Miner将数据集分割成大小相等的数据块,并将它们分配到不同的计算节点进行处理。每个计算节点都将使用GSPAN算法在其分配到的数据块上进行处理,并找到其频繁的子图。在这个阶段中,PG-Miner将运用高效的任务分配和动态调度策略,以确保计算负载的均衡和任务的高效执行。在第二阶段中,对所有计算节点找到的频繁子图进行全局合并,并通过额外的筛选过程,从中选择出频繁子图。所有计算节点使用相同的频繁子图发现方法,以确保在不同节点中发现的频繁子图是一致的。在这个阶段中,PG-Miner将使用高效的数据分发和通信策略,以便在保证数据一致性的同时,最小化计算时间和通信开销。根据实验结果显示,PG-Miner算法在各种数据集上都能够取得非常好的效果,而且在大规模数据集上表现尤为突出。比如,对于包含5亿个以上节点的数据集,PG-Miner能够在15分钟内完成挖掘,而传统的单机算法则需要几个小时或甚至更长时间。PG-Miner算法因其高效、易于扩展等优点,被广泛应用于图数据挖掘、社交网络分析等领域。总之,PG-Miner算法是一种非常有效的基于集群环境的频繁子图挖掘算法。通过并行地处理不同的数据块,并最终将结果合并为一个全局结果,能够高效地挖掘大规模数据集中的频繁子图。此外,PG-Miner算法还具有易于扩展和应用广泛等优点,值得我们在实际应用中加以探索和应用。

基于集群环境的并行频繁子图挖掘算法PG-Miner研究的综述报告 来自淘豆网www.taodocs.com转载请标明出处.

相关文档 更多>>
非法内容举报中心
文档信息
  • 页数2
  • 收藏数0 收藏
  • 顶次数0
  • 上传人niuww
  • 文件大小10 KB
  • 时间2024-04-14