巧用Percona Toolkit解决MySQL主从不同步问题

标签: General | 发表时间:2015-03-16 12:00 | 作者:ajaxj
出处:http://www.geek521.com

由于各种原因,mysql主从架构经常会出现数据不一致的情况出现,大致归结为如下几类

  • 1:备库写数据
  • 2:执行non-deterministic query
  • 3:回滚掺杂事务表和非事务表的事务
  • 4:binlog或者relay log数据损坏

数据不同步给应用带来的危害是致命的,当出现主从数据不一致的情况,常见的应对方法是先把从库下线,然后找个半夜三更的时间把应用停掉,重新执行同步,如果数据库的体积十分庞大,那工作量可想而知,会让人崩溃。本文介绍使用percona-toolkit工具对mysql主从数据库的同步状态进行检查和重新同步。

一:安装percona-toolkit

# yum -y install perl-Time-HiRes 
# wget 

http://www.percona.com/downloads/percona-toolkit/2.2.13/tarball/percona-toolkit-2.2.13.tar.gz

# tar -zxvpf percona-toolkit-2.2.13.tar.gz 
# cd percona-toolkit-2.2.13 
# perl Makefile.PL 
# make 
# make install

二:修改mysql 的binlog格式binlog_format参数为row格式

mysql binlog日志有三种格式,分别为Statement, Mixed,以及ROW!

1.Statement:

每一条会修改数据的sql都会记录在binlog中。

优点:不需要记录每一行的变化,减少了binlog日志量,节约了IO,提高性能。(相比row能节约多少性能与日志量,这个取决于应用的SQL情况,正常同一条记录修改或者插入row格式所产生的日志量还小于Statement产生的日志量,但是考虑到如果带条件的update操作,以及整表删除,alter表等操作,ROW格式会产生大量日志,因此在考虑是否使用ROW格式日志时应该跟据应用的实际情况,其所产生的日志量会增加多少,以及带来的IO性能问题。)

缺点:由于记录的只是执行语句,为了这些语句能在slave上正确运行,因此还必须记录每条语句在执行的时候的一些相关信息,以保证所有语句能在slave得到和在master端执行时候相同 的结果。另外mysql 的复制,像一些特定函数功能,slave可与master上要保持一致会有很多相关问题(如sleep()函数, last_insert_id(),以及user-defined functions(udf)会出现问题).

2.Row

不记录sql语句上下文相关信息,仅保存哪条记录被修改。

优点: binlog中可以不记录执行的sql语句的上下文相关的信息,仅需要记录那一条记录被修改成什么了。所以rowlevel的日志内容会非常清楚的记录下每一行数据修改的细节。而且不会出现某些特定情况下的存储过程,或function,以及trigger的调用和触发无法被正确复制的问题

缺点:所有的执行的语句当记录到日志中的时候,都将以每行记录的修改来记录,这样可能会产生大量的日志内容,比如一条update语句,修改多条记录,则binlog中每一条修改都会有记录,这样造成binlog日志量会很大,特别是当执行alter table之类的语句的时候,由于表结构修改,每条记录都发生改变,那么该表每一条记录都会记录到日志中。

3.Mixed

是以上两种level的混合使用,一般的语句修改使用statment格式保存binlog,如一些函数,statement无法完成主从复制的操作,则采用row格式保存binlog,MySQL会根据执行的每一条具体的sql语句来区分对待记录的日志形式,也就是在Statement和Row之间选择一种.新版本的MySQL中队row level模式也被做了优化,并不是所有的修改都会以row level来记录,像遇到表结构变更的时候就会以statement模式来记录。至于update或者delete等修改数据的语句,还是会记录所有行的变更。

主从数据库分别修改my.cnf文件相关配置项如下:

binlog_format=ROW

三:使用pt-table-checksum工具检查数据一致性情况

用法参考:

假设192.168.1.205是主库,192.168.1.207是它的从库,端口在3306。

1. 先校验

# pt-table-checksum --user=root --password=123456  
--host=192.168.1.205 --port=3306  
--databases=test --tables=t2 --recursion-method=processlist  
--no-check-binlog-format --nocheck-replication-filters  
--replicate=test.checksums

2. 根据校验结果,只修复192.168.1.207从库与主库不一致的地方:

# pt-table-sync --execute --replicate  
test.checksums --sync-to-master h=192.168.1.207,P=3306,u=root,p=123456

3. 修复后,再重新校验一次。执行第一步的语句即可。

4. 检查修复结果: 登陆到192.168.1.207,执行如下sql语句返回若为空,则说明修复成功:

SELECT 
* 
FROM 
test.checksums 
WHERE 
master_cnt <> this_cnt 
OR master_crc <> this_crc 
OR ISNULL(master_crc) <> ISNULL(this_crc)

各参数含义

  • –nocheck-replication-filters:不检查复制过滤器,建议启用。后面可以用–databases来指定需要检查的数据库。
  • –no-check-binlog-format:不检查复制的binlog模式,要是binlog模式是ROW,则会报错。
  • –replicate-check-only:只显示不同步的信息。
  • –replicate=:把checksum的信息写入到指定表中,建议直接写到被检查的数据库当中。
  • –databases=:指定需要被检查的数据库,多个则用逗号隔开。
  • –tables=:指定需要被检查的表,多个用逗号隔开
  • h=127.0.0.1:Master的地址
  • u=root:用户名
  • p=123456:密码
  • P=3306:端口

下面我们来模拟下主从数据库不同步情况下的pt-table-checksum,为了方便,这里我们采用test schema

1: 主库上建表,插入测试数据

mysql> create table t2 (id int primary key,name varchar(100) not null,salary int); 
mysql> CREATE PROCEDURE test_insert () 
BEGIN 
DECLARE i INT DEFAULT 0; 
WHILE i<10000 
DO 
INSERT INTO t2 
VALUES 
(i,CONCAT(’员工’,i), i); 
SET i=i+1; 
END WHILE ; 
END;; 
mysql> CALL test_insert();

从库上校验当前数据的同步情况为正常。

从库上删除一半的数据

mysql> delete from t2 where id > 5000; 
Query OK, 4999 rows affected (0.14 sec) 

mysql> select count(*) from t2; 
+----------+ 
| count(*) | 
+----------+ 
| 5001 | 
+----------+ 
1 row in set (0.01 sec)

2:使用pt-table-checksum工具进行校验:

# pt-table-checksum --user=root --password=123456  
--host=192.168.1.205 --port=3306  
--databases=test --tables=t2 --recursion-method=processlist  
--no-check-binlog-format --nocheck-replication-filters  
--replicate=test.checksums

3:登陆从库进行查询checksum表

mysql> SELECT 
* 
FROM 
test.checksums 
WHERE 
master_cnt <> this_cnt 
OR master_crc <> this_crc 
OR ISNULL(master_crc) <> ISNULL(this_crc)

4:使用pt-table-sync工具进行数据重新同步

# pt-table-sync --execute --replicate  
test.checksums --sync-to-master h=192.168.1.207,P=3306,u=root,p=123456

5:从库上验证数据,中文“员工”变成了“??”

检查主库,发现出现一样的情况,中文“员工”变成了“??”,猜想和字符集设置相关。

于是检查数据库字符集设置,发现test库字符集非utf8

主从库my.cnf文件添加如下配置项后重启数据库实例

character_set_client=utf8 
character_set_server=utf8

重新执行以上1-4步,发现一切正常!关键第4步要加–charset=utf8 参数

# pt-table-sync --execute --replicate  
test.checksums --charset=utf8  
--sync-to-master h=192.168.1.207,P=3306,u=root,p=123456

相关 [percona toolkit mysql] 推荐:

巧用Percona Toolkit解决MySQL主从不同步问题

- - 极客521 | 极客521
由于各种原因,mysql主从架构经常会出现数据不一致的情况出现,大致归结为如下几类. 2:执行non-deterministic query. 3:回滚掺杂事务表和非事务表的事务. 4:binlog或者relay log数据损坏. 数据不同步给应用带来的危害是致命的,当出现主从数据不一致的情况,常见的应对方法是先把从库下线,然后找个半夜三更的时间把应用停掉,重新执行同步,如果数据库的体积十分庞大,那工作量可想而知,会让人崩溃.

Percona Xtrabackup MySQL 全备

- - CSDN博客数据库推荐文章
作者:ylqmf 发表于2013-3-24 17:29:55 原文链接. 阅读:99 评论:0 查看评论.

使用Percona XtraBackup备份MySQL

- - searchdatabase
  Percona XtraBackup是一款开放源码,免费的MySQL热备份软件,以非阻塞方式执行备份InnoDB和XtraDB为存储引擎的数据库,是商业备份工具InnoDB Hotbackup的一个很好的替代品. 作者的前一家公司就花了不菲美元买了Hotbackup产品.     下载地址: http://www.searchdatabase.com.cn/softwaredownload_10241.htm.

Percona 的 MySQL High Availability 機制比較文

- - Gea-Suan Lin's BLOG
Percona 發了一篇「 High-availability options for MySQL, October 2013 update」,比較目前 MySQL 上常見的 High Availability 機制. 這些都是把 High Availability 做在 MySQL 上,讓前端的程式不需要操心的方式.

MySQL分支的选择:Percona还是MariaDB

- - 标点符
在MySQL被Oracle收购以后,越来越多的人对于MySQL的前景表示了担忧,对于开源的MySQL,或多或少对于Oracle自家的数据库产品产生冲击,这个开源免费的MySQL 对于Oracle更多的是包袱而不是资产. 比如淘宝就从Oracle转成了MySQL,一些大型互联网公司也在推行去IOE(I:IBM,O:Oracle,E:EMC),甲骨文公司收购了MySQL后,有将MySQL闭源的潜在风险,因此社区采用分支的方式来避开这个风险.

MySQL出了门,Percona在左,MariaDB在右

- - MySQL中文网
前言:作为没有自主研发能力的企业,MySQL、Percona、MariaDB到底该选择哪个. 今天看到SOHU-DBA公众号推送的文章:《MySQL分支的选择:Percona还是MariaDB》,原文出处: http://www.biaodianfu.com/mysql-percona-or-mariadb.html,这个文章比较长,有兴趣的可以找到原文看看,我也来简单说下我的看法.

MySQL 的衍生版本 - Percona、MariaDB、MySQL branch at Google - 2012

- - Tsung's Blog
自從 MySQL 被 Oracle 買過去後, 依照 MySQL 原本架構再開發出衍生的版本, 連 Google 都來插一腳囉~. MySQL 的衍生版本 - Percona、MariaDB、MySQL branch at Google. Percona - Experts in MySQL, InnoDB, and LAMP Performance - 目前進展非常迅速..

MySQL vs MariaDB vs Percona 之TPCC性能测试

- - MySQL 中文网 -
是由原来 MySQL 的作者 Michael Widenius 创办的公司所开发的免费开源的数据库服务器. MariaDB基于事务的Maria存储引擎,替换了MySQL的MyISAM存储引擎,它使用了Percona的 XtraDB,InnoDB的变体. 这个版本还包括了 PrimeBase XT (PBXT) 和 FederatedX 存储引擎.

MySQL 5.6.10 vs Percona 5.6.6之TPCCC性能测试

- - MySQL 中文网
MySQL官方5.6.10版本出来后,号称比以往版本性能提升了很多,实际测试了下,确实有所提升,但相比Percona 5.6.6在性能方面还是没有优势. 3、InnoDB关键配置选项. ring replication:是指3个节点搭建环形复制,各自分别都是master/slave. 在测试过程中,还尝试模拟master宕机,slave任意切换master,验证GTID模式下的数据可靠性,在测试模式下,确实保证了数据可靠性.

一次惊心动魄的Percona XTRADB Cluster数据修复过程【MySQL】

- - CSDN博客推荐文章
一次惊心动魄的Percona XTRA Cluster DB数据修复过程.         2014.12.27日中午约12:30,电话响起,是同事YI的电话,告之说库中出现大量死锁,用“service mysql restart”无法重启. 这里我先说明下:我们在移动音乐项目中使用的是. Percona XTRA Cluster DB,在生成环境中,建议最低是3个节点.