重庆大学博士学位论文
数据网格中高可用性副本管理
及性能优化研究
博士研究生:吴长泽
指导教师:陈蜀宇 教 授
学科、专业:计算机应用
重庆大学计算机学院
二 OO 七年十月
. Dissertation of Chongqing University
Research of High availability Replica
Management and Performance
Optimization in Data Grid
. Candidate: Wu Changze
Supervisor: Prof. Chen Shuyu
Major: Computer Science
College of Computer Science
Chongqing University
October 2007
摘 要
数据网格的出现解决了传统的数据管理系统难以对大规模的、分布式的数据
进行数据访问、传送、分析的难题。极大地推动了涉及大规模数据管理的科学研
究和工程实践的发展。为了在数据管理中提高数据可用性、减少网络流量、增强
数据访问性能,在数据网格中引入了副本管理技术。然而,由于数据网格系统本
身及其资源的高度动态性、异构性、广域性的特点,阻碍了数据高可用性及性能
优化的取得。如何针对数据网格的特点,建立恰当的副本管理机制,切实提高数
据网格中数据的可用性和改善数据访问性能,已成为数据网格中的一个研究热点。
本文基于相关研究成果的对比研究,总结了数据网格中的副本管理需求,给
出了一种动态副本管理服务模型,并据此提出了相应的自适应副本创建策略、动
态均衡的副本定位算法、基于模糊灰预测的副本选择算法和动态异步的副本一致
性维护算法,分别是:
① 根据数据网格的特点,分别分析了数据网格中副本数据高可用性需求及数
据访问性能优化需求,建立了一种动态副本管理服务模型,能够满足数据网格动
态性,提高了数据可用性,优化了数据访问性能。
② 针对数据网格副本管理中的副本创建问题,采用 Markov 模型计算了副本
冗余度,考虑了多个副本数据不一致对可用性的影响,更准确的保障了数据可用
性。并提出了基于开销分摊的副本创建策略,在节点自治的前提下取得了全局性
能优化。从理论上证明了开销分摊副本创建算法的正确性和全局性能优化特性。
最后,通过仿真实验进一步验证了算法的有效性和正确性。
③ 针对数据网格副本管理中的副本定位问题,在改进蚁群算法的基础上,提
出了一种动态均衡的副本定位算法,能够自适应节点的动态加入和退出进行准确
定位,提高了数据访问性能。针对数据网格副本管理中的副本选择问题,在提出
的动态均衡副本定位算法基础上,提出了一种基于模糊灰预测的副本选择算法,
对预测样本要求低,通过模糊控制器的优化,获得了较高的预测精度。最后通过
仿真实验确定了模糊控制器自学****因子的选取,并验证了副本定位算法与副本选
择算法的有效性和正确性。
④ 针对数据网格副本管理中的副本一致
数据网格中高可用性副本管理及性能优化研究 来自淘豆网www.taodocs.com转载请标明出处.