下载此文档

分布式数据库中间件DBScale的设计与实现-软件工程专业毕业论文.docx


文档分类:IT计算机 | 页数:约82页 举报非法文档有奖
1/82
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/82 下载此文档
文档列表 文档介绍
Classified Index: TP319 .:
Dissertation for the Master’s Degree in Engineering
THE DESIGN AND IMPLEMENTATION OF DISTRIBUTED DATABASE MIDDLEWARE
DBScale
Candidate: Yang Fei
Supervisor: Associate Professor Li Quanlong
Associate Supervisor: Engineer He Zhenxing Academic Degree Applied for: Master of Engineering Speciality: Software Engineering
Affiliation: School of Software
Date of Defence: June, 2015
Degree-Conferring-Institution: Harbin Institute of Technology
摘 要
随着大数据时代的到来,数据量变得越来越大,数据处理变得越来越困难, 传统的单机关系型数据库已经很难满足现在的商业需求了,因此本文引入以关系型数据库 MySQL 为基础的分布式数据库中间件。分布式数据库中间件可以让用户使用起来与单机 MySQL 保持一致,对原有的应用无需进行任何代码的修改。
本文主要涉及分布式数据库中间件的研究,包括了三个模块的研究:分别为分布式数据库中间件的分库分表功能,分布式数据库中间件的跨节点多表联查功能以及分布式数据库中间件的分布式存储过程功能。对于表的拆分是每一个分布式数据库产品都必须要实现的,也是必须高效实现的,本文在传统的哈希分区的方法上,使用一致性哈希算法进行虚拟分区,从而达到易扩展的目的; 对于跨节点多表联查这一业界难题,本文分成三种情况进行讨论,即两张非分区表进行联查,两张分区表分进行联查以及一张非分区表和一张分区表进行联查。无论哪一种情况本文的核心思想就是尽量减少数据的迁移数量,为此本文引入了一系列的优化手段;最后的分布式存储过程,本文对 MySQL 标准的存储过程进行了完整的分布式支持,包括声明表达,复合表达,循环表达,条件分支判断表达以及游标表达。
本文通过对分布式数据库中间件 DBScale 的分表功能测试,发现随着后端 MySQL 实例的增多,中间件的性能是线性增长的;通过对本文实现的多节点多表联查解决方案的测试,发现使用 Federated 存储引擎可以将跨节点多表联查操作的性能提高为 MySQL 单机的 50%;通过与 cobar 以及 ha-proxy 的单机损耗对比测试,发现 DBScale 的性能要全面优于 cobar,在低并发下性能略逊于 ha-proxy,高并发性能明显优于 ha-proxy。
关键词: 分布式数据库,中间件,跨节点多表联查,MySQL, DBScale
Abstract
It’s more and more difficult for traditional stand-alone relational database to process growing big data. This paper will introduce a distributed database middleware DBScale based on MySQL which is most popular open source relational database. The distributed database middleware can be used just like MySQL and the original application program do not need to modify any code which only need to migrate data from MySQL to DBScale.
This paper will study the distributed database middleware, including three modules. The first is the schema spilted and table splited. The second is cross node join. The last is the distributed stored procedure. It must to implement the table splited efficiently for each distributed

分布式数据库中间件DBScale的设计与实现-软件工程专业毕业论文 来自淘豆网www.taodocs.com转载请标明出处.

非法内容举报中心
文档信息
  • 页数82
  • 收藏数0 收藏
  • 顶次数0
  • 上传人wz_198613
  • 文件大小1.10 MB
  • 时间2018-11-06