您好、欢迎来到现金彩票网!
当前位置:2019管家婆最准的资料_管家婆2019年资料大全_管家婆今期免费资料 > 同步距离 >

异地多活场景下的数据同步之道

发布时间:2019-08-09 02:36 来源:未知 编辑:admin

  在当今互联网行业,大多数人互联网从业者对单元化、异地多活这些词汇已经耳熟能详。而数据同步是异地多活的基础,所有具备数据存储能力的组件如:数据库、缓存、MQ等,数据都可以进行同步,形成一个庞大而复杂的数据同步拓扑。

  本文将先从概念上介绍单元化、异地多活、就近访问等基本概念。之后,将以数据库为例,讲解在数据同步的情况下,如何解决数据回环、数据冲突、数据重复等典型问题。

  如果仅仅从单元化”这个词汇的角度来说,我们可以理解为将数据划分到多个单元进行存储。单元是一个抽象的概念,通常与数据中心(IDC)概念相关,一个单元可以包含多个IDC,也可以只包含一个IDC。本文假设一个单元只对应一个IDC。

  考虑一开始只有一个IDC的情况,所有用户的数据都会写入同一份底层存储中,如下图所示:

  一个IDC必然只能部署在一个地区,例如部署在北京,那么北京的用户访问将会得到快速响应;但是对于上海的用户,访问延迟一般就会大一点,上海到北京的一个RTT可能有20ms左右。

  这里容灾不是单台机器故障,而是指机房断电、自然灾害或者光纤被挖断等重大灾害。一旦出现这种问题,将无法正常为用户提供访问,甚至出现数据丢失的情况。

  这并不是不可能,例如:2015年,支付宝杭州某数据中心的光缆就被挖断过;2018年9月,云栖大会上,蚂蚁金服当场把杭州两个数据中心的网线剪断。

  为了解决这些问题,我们可以将服务部署到多个不同的IDC中,不同IDC之间的数据互相进行同步。如下图:

  2)容灾问题。当一个机房挂了之后,我们可以将这个机房用户的流量调度到另外一个正常的机房,由于不同机房之间的数据是实时同步的,用户流量调度过去后,也可以正常访问数据 (故障发生那一刻的少部分数据可能会丢失)。

  需要注意的是,关于容灾,存在一个容灾级别的划分,例如:单机故障,机架(rack)故障,机房故障,城市级故障等。

  上面的案例中,我们使用了2个IDC,但是2个IDC并不能具备机房容灾能力。

  至少需要3个IDC,例如,一些基于多数派协议的一致性组件,如Zookeeper,Redis、etcd、consul等,需要得到大部分节点的同意。

  例如我们部署了3个节点,在只有2个机房的情况下, 必然是一个机房部署2个节点,一个机房部署一个节点。

  在3机房的情况下,每个机房部署一个节点,任意一个机房挂了,还剩2个节点,还是可以形成多数派。这也就是我们常说的两地三中心”。

  在发生重大自然灾害的情况下,可能整个城市的机房都无法访问。一些组件,例如蚂蚁的ocean base,为了达到城市级容灾的能力,使用的是三地五中心的方案。

  这种情况下,3个城市分别拥有2、2、1个机房。当整个城市发生灾难时,其他两个城市依然至少可以保证有3个机房依然是存活的,同样可以形成多数派。

  如果仅仅是考虑不同地区的用户数据就近写入距离最近的IDC,这是纯粹意义上的”单元化”。

  不同单元的之间数据实时进行同步,相互备份对方的数据,才能做到真正意义上异地多活”。

  实现单元化,技术层面我们要解决的事情很多,例如:流量调度,即如何让用户就近访问附近的IDC;数据互通,如何实现不同机房之间数据的相互同步。

  需要同步的组件有很多,例如数据库、缓存等,这里以多个MySQL集群之间的数据同步为例进行讲解,实际上缓存的同步思路也是类似。

  为了了解如何对不同MySQL的数据相互进行同步,我们先了解一下MySQL主从复制的基本架构,如下图所示:

  通常一个MySQL集群有一主多从构成。用户的数据都是写入主库Master,Master将数据写入到本地二进制日志binary log中。

  基于这个背景知识,我们就可以考虑自己编写一个组件,其作用类似与MySQL slave,也是去主库上拉取binlog,只不过binlog不是保存到本地,而是将binlog转换成sql插入到目标MySQL集群中,实现数据的同步。

  这并非是一件不可能完成的事,MySQL官网上已经提供好所有你自己编写一个MySQL slave 同步binlog所需的相关背景知识,访问这个链接:,你将可以看到MySQL客户端与服务端的通信协议。

  当然,笔者的目的并不是希望读者真正的按照这里的介绍尝试编写一个MySQL的slave,只是想告诉读者,模拟MySQL slave拉取binlog并非是一件很神奇的事,只要你的网络基础知识够扎实,完全可以做到。

  然而,这是一个庞大而复杂的工作。以一人之力,要完成这个工作,需要占用你大量的时间。

  好在,现在已经有很多开源的组件,已经实现了按照这个协议可以模拟成一个MySQL的slave,拉取binlog。例如:

  你可以利用这些组件来完成数据同步,而不必重复造轮子。假设你采用了上面某个开源组件进行同步,需要明白的是这个组件都要完成最基本的2件事:

  为什么划分成两块独立的功能?因为binlog订阅解析的实际应用场景并不仅仅是数据同步,如下图:

  因此,通常我们把binlog syncer单独作为一个模块,其只负责解析从数据库中拉取并解析binlog,并在内存中缓存(或持久化存储)。

  另外,binlog syncer另外提一个sdk,业务方通过这个sdk从binlog syncer中获取解析后的binlog信息,然后完成自己的特定业务逻辑处理。

  显然,在数据同步的场景下,我们可以基于这个sdk,编写一个组件专门用于将binlog转换为sql,插入目标库,实现数据同步,如下图所示:

  北京用户的数据不断写入离自己最近的机房的DB,通过binlog syncer订阅这个库binlog,然后下游的binlog writer将binlog转换成SQL,插入到目标库。

  上海用户类似,只不过方向相反,不再赘述。通过这种方式,我们可以实时的将两个库的数据同步到对端。当然事情并非这么简单,我们有一些重要的事情需要考虑。

  通常,MySQL不会保存所有的历史binlog。原因在于,对于一条记录,可能我们会更新多次,这依然是一条记录,但是针对每一次更新操作,都会产生一条binlog记录,这样就会存在大量的binlog,很快会将磁盘占满。

  因此DBA通常会通过一些配置项,来定时清理binlog,只保留最近一段时间内的binlog。

  例如,官方版的MySQL提供了expire_logs_days配置项,可以设置保存binlog的天数,笔者这里设置为0,表示默认不清空,如果将这个值设置大于0,则只会保存指定的天数。

  通常,如果binlog如果从来没被清理过,那么binlog文件名字后缀通常是000001,如果不是这个值,则说明可能已经被清理过。当然,这也不是绝对,例如执行reset master”命令,可以将所有的binlog清空,然后从000001重新开始计数。

  Whatever! 我们知道了,binlog可能不会一直保留,所以直接同步binlog,可能只能获取到部分数据。

  因此,通常的策略是,由DBA先dump一份源库的完整数据快照,增量部分,再通过binlog订阅解析进行同步。

  考虑以下情况下,源库中的一条记录没有唯一索引。对于这个记录的binlog,通过sql writer将binlog转换成sql插入目标库时,抛出了异常,此时我们并不知道是否插入成功了,则需要进行重试。

  如果之前已经是插入目标库成功,只是目标库响应时网络超时(socket timeout)了,导致的异常,这个时候重试插入,就会存在多条记录,造成数据不一致。

  由于两边的库都存在数据插入,如果都使用了同一个唯一索引,那么在同步到对端时,将会产生唯一索引冲突。

  对于这种情况,通常建议是使用一个全局唯一的分布式ID生成器来生成唯一索引,保证不会产生冲突。

  另外,如果真的产生冲突了,同步组件应该将冲突的记录保存下来,以便之后的问题排查。

  如果数据库表中已经有大量数据,例如千万级别、或者上亿,这个时候对于这个表的DDL变更,将会变得非常慢,可能会需要几分钟甚至更长时间,而DDL操作是会锁表的,这必然会对业务造成极大的影响。

  因此,同步组件通常会对DDL语句进行过滤,不进行同步。DBA在不同的数据库集群上,通过一些在线DDL工具(如gh-ost),进行表结构变更。

  数据回环问题,是数据同步过程中,最重要的问题。我们针对INSERT、UPDATE、DELETE三个操作来分别进行说明:

  假设在A库插入数据,A库产生binlog,之后同步到B库,B库同样也会产生binlog。由于是双向同步,这条记录,又会被重新同步回A库。由于A库应存在这条记录了,产生冲突。

  先考虑针对A库某条记录R只有一次更新的情况,将R更新成R1,之后R1这个binlog会被同步到B库,B库又将R1同步会A库。对于这种情况下,A库将不会产生binlog。

  在一个更新操作并没有改变某条记录值的情况下,MySQL是不会产生binlog,相当于同步终止。

  上图数据中原本有一条记录(1,tianshouzhi”),之后执行一个update语句,将id=1的记录的name值再次更新为“tianshouzhi”,意味着值并没有变更。

  这个时候,我们看到MySQL返回的影响的记录函数为0,也就是说并不会产生真是的更新操作。然而这并不意味UPDATE 操作没有问题,事实上,其比INSERT更加危险。

  考虑A库的记录R被连续更新了2次,第一次更新成R1,第二次被更新成R2;这两条记录变更信息都被同步到B库,B也产生了R1和R2。

  由于B的数据也在往A同步,B的R1会被先同步到A,而A现在的值是R2,由于值不一样,将会被更新成R1,并产生新的binlog;此时B的R2再同步会A,发现A的值是R1,又更新成R2,也产生binlog。由于B同步回A的操作,让A又产生了新的binlog,A又要同步到B,如此反复,陷入无限循环中。

  同样存在先后顺序问题。例如先插入一条记录,再删除。B在A删除后,又将插入的数据同步回A,接着再将A的删除操作也同步回A,每次都会产生binlog,陷入无限回环。

  关于数据回环问题,笔者有着血的教训,曾经因为笔者的误操作,将一个库的数据同步到了自身,最终也导致无限循环,原因分析与上述提到的UPDATE、DELETE操作类似,读者可自行思考。

  针对上述数据同步到过程中可能会存在的数据回环问题,最终会导致数据无限循环,因此我们必须要解决这个问题。由于存在多种解决方案,我们将在稍后统一进行讲解。

  现在,让我们先把思路先从解决数据同步的具体细节问题转回来,从更高的层面讲解数据同步的架构应该如何设计。稍后的内容中,我们将讲解各种避免数据回环的各种解决方案。

  前面的架构中,只涉及到2个DB的数据同步,如果有多个DB数据需要相互同步的情况下,架构将会变得非常复杂。例如:

  从源库订阅binlog的时候,由于这个GTID也可以被解析到,之后在往目标库同步数据的时候,我们可以显示的的指定这个GTID,不让目标自动生成。

  由于我们显示指定了GTID,目标库就会使用这个GTID当做当前事务ID,不会自动生成。同样,这个操作也会在目标库产生binlog信息,需要同步回源库。

  再往源库同步时,我们按照相同的方式,先设置GTID,在执行解析binlog后得到的SQL,还是上面的内容

  注意这里,对于一条insert语句,其影响的记录函数居然为0,也就会插入并没有产生记录,也就不会产生binlog,避免了循环问题。

  如何做到的呢?MySQL会记录自己执行过的所有GTID,当判断一个GTID已经执行过,就会忽略。通过如下sql查看:

  上述value部分,冒号:前面的是server_uuid,冒号后面的1-5,是一个范围,表示已经执行过1,2,3,4,5这个几个transaction_id。

  这里就能解释了,在GTID模式的情况下,为什么前面的插入语句影响的记录函数为0了。

  显然,GTID除了可以帮助我们避免数据回环问题,还可以帮助我们解决数据重复插入的问题,对于一条没有主键或者唯一索引的记录,即使重复插入也没有,只要GTID已经执行过,之后的重复插入都会忽略。

  当然,我们还可以做得更加细致,不需要每次都往目标库设置GTID_NEXT,这毕竟是一次网络通信。

  sql writer在往目标库插入数据之前,先判断目标库的server_uuid是不是和当前binlog事务信息携带的server_uuid相同,如果相同,则可以直接丢弃。

  GTID应该算是一个终极的数据回环解决方案,MySQL原生自带,比添加一个辅助表的方式更轻量,开销也更低。

  需要注意的是,这倒并不是一定说GTID的方案就比辅助表好,因为辅助表可以添加机房等额外信息。

  在一些场景下,如果下游需要知道这条记录原始产生的机房,还是需要使用辅助表。

  前面深入讲解了单元化场景下数据同步的基础知识。读者可能比较感兴趣的是,哪些开源组件在这些方面做的比较好。笔者建议的首选,是canal/otter组合。

  canal的作用就是类似于前面所述的binlog syncer,拉取解析binlog。otter是canal的客户端,专门用于进行数据同步,类似于前文所讲解的sql writer。并且,canal的最新版本已经实现了GTID。

  另外,笔者也在自己的博客上写了一个canal系列的源码分析教程,完成了大部分。相信对于需要深入阅读canal源码的用户有一定的借鉴意义。点击阅读原文,即可查 看。

http://acpeo.com/tongbujuli/711.html
锟斤拷锟斤拷锟斤拷QQ微锟斤拷锟斤拷锟斤拷锟斤拷锟斤拷锟斤拷微锟斤拷
关于我们|联系我们|版权声明|网站地图|
Copyright © 2002-2019 现金彩票 版权所有