mysql分布式数据库适合做数据仓库么

2024-05-13 03:21

1. mysql分布式数据库适合做数据仓库么

数据仓库就是数据库,只不过是按照业界不同的提法说法不同而已; 一般的数据仓库的说法是要建立一个高性能的可查询数据库,一般说来是提供高效的查询而不是交互。

从软件出发考虑:

MySQL现有的几种数据库从5.5后缺省的数据引擎是Innodb, 性能在查询上和MyISAM差不多,不过对事物的支持更加好。 如果需要建立一个有规模的数据仓库首先必须考虑查询和聚合运算的效率问题, 从MySQL内部的函数的使用效率出发选用innodb可以支持复杂的存储过程让运算集中在服务器上运行,可以高效的发挥服务器的运算性能和SQL集合运算的效率。

从平台考虑:
数据仓库的数据源可能来自不同的操作系统和数据库, 怎么把数据同步到本地可以参考通用的方法,作为数据仓库需要考虑的是数据的一致性,比如一个流程的不同环节的数据来自不同的数据库,这时就需要考虑怎么来定制来保证数据的时效和一致,比如不允许第一步的数据还未进行同步,第二步的数据就已经同步到本地,这样的话后台的应用在读取数据的时候就会非常的混乱

从硬件出发考虑:
数据仓库一般是从业务数据库导出到另外一个独立数据库作为计算分析, 这样的好处在于把计算分开,避免非业务的大规模运算对正常业务的影响。即使软硬件崩溃也不会对正常业务造成影响,而数据重建只需要按照原来的方法恢复即可。在往数据仓库上同步数据的过程要灵活考虑数据同步的方法,缺省可直接使用Mysql的主从备份。 如果不想对业务服务器造成太多影响,也可以采用自己定制的方法来进行增量备份和差异备份。

从SQL的使用出发考虑:
能够交由SQL完成的工作最好全部使用SQL来完成聚合,表和表进行联合的时候先进行添加约束,和外部的程序,比如统计分析的计算,尽量让SQL输出一个计算后的数据集给后台应用。

mysql分布式数据库适合做数据仓库么

2. Mysql变成分布式数据库

 1、amoeba相当于一个SQL请求的路由器,目的是为负载均衡、读写分离、高可用性提供机制,而不是完全实现它们。用户需要结合使用MySQL的Replication等机制来实现副本同步等功能。amoeba对底层数据库连接管理和路由实现也采用了可插拨的机制,第三方可以开发更高级的策略类来替代作者的实现。这个程序总体上比较符合KISS的思想。
  2、由上一条,建议使用MySQL的Replication机制建立Master-Slave来做副本。我一开始理解有误,使用了amoeba的virtual DB(负载均衡pool)做writePool,结果使得本应插入同一个表中的数据被拆分地写入了不同的物理数据库中。这样自然与副本的语义不符了。
  3、amoeba已经实现了数据的垂直切分与水平切分。水平切分方面,粒度是行。使用SQLJEP语句可以设计出复杂的切分规则,个人认为是比较强大的。垂直切分的粒度是表,可以把针对不同表的请求发送到不同的节点上执行,但不能以列作为分片粒度。从作者的说法看,amoeba不做SQL解析和重写。在目前的机制下似乎是难以实现同一个表不同的列在不同节点上的分布。不过对开发人员来说,设计良好的表结构应该可以实现简单的基于关系属性的负载均衡的。

3. 万里开源分布式数据库支持MySQL协议吗?

万里开源是前MySQL中国研发中心,多年来一直基于MySQL数据库开发GreatDB产品,100%兼容MySQL生态的。

万里开源分布式数据库支持MySQL协议吗?

4. mysql分布式数据库问题

要数据同步就做双机热备,要仅仅为了异地访问,就在防火墙上把3306端口映射出来,然后给相应的用户开远程登录数据库的权限

5. mysql如何实现分布式数据库

应该是通过ndb的cluster来实现啊,你只需在网上找mysql cluster的资料就可以知道了。在mysql官方网站上可以下载到,如《mysql cluster维护手册.docx》等

mysql如何实现分布式数据库

6. 如何在Windows环境下搭建Mysql分布式数据库环境

安装一个wamp5就有了

7. MYSQL分布式数据库操作 急~~~~~~``

可以参考"订阅服务器和分发" 使数据库表同步。 

就是从本地数据库表更新到远程数据库表是同步进行的 
打开企业管理器→工具→复制→创建和管理发布→创建发布→下步选要发布的数据库→选否,定义选项和属性→(根据情况选发布类型)事务发布→下步选择你要发布的数据表→编辑名称(随便)→否,根据指定方式创建发布→完成 
*创建完成了发布在开始订阅远程的数据库 
企业管理器→工具→复制→创建和管理发布→展开你所创建发布的数据库选择 
发布的表→强制新订阅→下一步→选择远程服务器(如果没有就先到企业管理器上连接)→*编要订阅的数据库名(这里是很多新手会搞错的地方:是需订阅的远程数据库名)→是,初始化(这项是没做过复制的数据库可选,如果以前做过的选择此项就会导至以前订阅的数据丢失。*做过复制的数据库可选"否")→完成 
远程也同上。

可以找两台PC试一下。

MYSQL分布式数据库操作  急~~~~~~``

8. 分布式数据库对性能测试有没有影响

版本MySQL 3.22MySQL单表限4GBMySQL存储引擎ISAM存储引擎现MyISAM存储引擎MySQL 3.23始MySQL单表限制已经扩64PB(官文档显示)说目前技术环境看MySQL数据库MyISAM存储 引擎单表限制已经MySQL数据库本身决定由所主机OS面文件系统决定    MySQL另外流行存储引擎Innodb存储数据策略两种种共享表空间存储式种独享表空间存储式   使用共享表空间存储式候Innodb所数据保存单独表空间面表空间由文件组表跨文件存所 其限制再文件限制其自身限制Innodb官文档看其表空间限制64TB说Innodb单 表限制基本64TB左右包括表所索引等其相关数据   使用独享表空间存放Innodb表候每表数据单独文件存放候单表限制变文件系统限制
最新文章
热门文章
推荐阅读