Mysql和Redis数据同步策略 - 元思 - 博客园

标签: | 发表时间:2020-06-24 09:55 | 作者:
出处:https://www.cnblogs.com

为什么对缓存只删除不更新

不更新缓存是防止并发更新导致的数据不一致。
所以为了降低数据不一致的概率,不应该更新缓存,而是直接将其删除,
然后等待下次发生cache miss时再把数据库中的数据同步到缓存。

先更新数据库还是先删除缓存?

有两个选择:
1. 先删除缓存,再更新数据库
2. 先更新数据库,再删除缓存

如果先删除缓存,有一个明显的逻辑错误:考虑两个并发操作,线程A删除缓存后,线程B读该数据时会发生Cache Miss,然后从数据库中读出该数据并同步到缓存中,此时线程A更新了数据库。
结果导致,缓存中是老数据,数据库中是新数据,并且之后的读操作都会直接读取缓存中的脏数据。(直到key过期被删除或者被LRU策略踢出)
如果数据库更新成功后,再删除缓存,就不会有上面这个问题。
可能是由于数据库优先,第二种方式也被称为Cache Aside Pattern。

Cache Aside Pattern

cache aside在绝大多数情况下能做到数据一致性,但是在极端情况仍然存在问题。

  • 首先更新数据库(A)和删除缓存(B)不是原子操作,任何在A之后B之前的读操作,都会读到redis中的旧数据。
    但是,正常情况下操作缓存的速度会很快,通常是毫秒级,出现上述情况的概率很低。
  • 更新完数据库后,线程意外被kill掉,由于没有删除缓存,缓存中的脏数据会一直存在。
  • 线程A读数据时cache miss,从Mysql中查询到数据,还没来得及同步到redis中,
    此时线程B更新了数据库并把Redis中的旧值删除。随后,线程A把之前查到的数据同步到了Redis。
    显然,此时redis中的是脏数据。
    通常数据库读操作比写操作快很多,所以除非线程A在同步redis前意外卡住了,否则发生上述情况的概率极低。

虽然以上情况都有可能发生,但是发生的概率相比“先删除缓存再更新数据库”会低很多。

Read/Write Through Pattern

cache aside是我们自己的应用程序维护两个数据存储系统,而Read/Write Through Pattern是把同步数据的问题交给缓存系统了,应用程序不需要关心。
Read Through是指发生cache miss时,缓存系统自动去数据库加载数据。
Write Through是指如果cache miss,直接更新数据库,然后返回,如果cache hit,则更新缓存后,由缓存系统自动同步到数据库。
以Redis为例,通常我们不会把数据库的数据全部缓存到redis,而是采用一定的数据精简或压缩策略,以节省缓存空间。
就是说,让缓存系统设计出通用的缓存方案不太现实,不过根据自己的业务定制一个在项目内部通用的中间件是可行的。

Write Behind

Write Behind方案在更新数据时,只更新缓存,不更新数据库。而是由另外一个服务异步的把数据更新到数据库。
逻辑上,和Linux中的write back很类似。这个设计的好处是,I/O操作很快,因为是纯内存操作。
但是由于异步写库,可能要牺牲一些数据一致性,譬如突然宕机会丢失所有未写入数据库的内存数据。

阿里巴巴的Canal中间件是一种相反的设计,它先更新mysql,然后通过binlog把数据自动同步到redis。
这种方案会全量同步数据到redis,不适合只缓存热点数据的应用。

总结

以上没有哪种方案是完美的,都无法做到强一致性。
我们总要在性能和数据准确性之间做出妥协。

https://www.pixelstech.net/article/1562504974-Consistency-between-Redis-Cache-and-SQL-Database
https://coolshell.cn/articles/17416.html
为什么不更新缓存,而是直接删除

相关 [mysql redis 数据] 推荐:

Mysql和Redis数据同步策略 - 元思 - 博客园

- -
不更新缓存是防止并发更新导致的数据不一致. 所以为了降低数据不一致的概率,不应该更新缓存,而是直接将其删除,. 然后等待下次发生cache miss时再把数据库中的数据同步到缓存. 如果先删除缓存,有一个明显的逻辑错误:考虑两个并发操作,线程A删除缓存后,线程B读该数据时会发生Cache Miss,然后从数据库中读出该数据并同步到缓存中,此时线程A更新了数据库.

JAVA通过Gearman实现MySQL到Redis的数据同步(异步复制)

- - 企业架构 - ITeye博客
MySQL到Redis数据复制方案. 无论MySQL还是Redis,自身都带有数据同步的机制,像比较常用的 MySQL的Master/Slave模式 ,就是由Slave端分析Master的binlog来实现的,这样的数据复制其实还是一个异步过程,只不过当服务器都在同一内网时,异步的延迟几乎可以忽略.

Redis 数据类型

- - ITeye博客
该文章是对Redis官方文档的翻译. 字符串是Redis值的最基础的类型. Redis字符串是二进制安全的,这意味着一个Redis字符串可以包含任何种类的数据,例如一个JPEG图像或者一个序列化的Ruby对象. 一个字符串值最多可以保存512M字节的内容. 你可以使用Redis的字符串做一些有趣的事情,例如你可以:.

REDIS与MYSQL实现标签的对比

- - CSDN博客推荐文章
这里来演示下REDIS和MYSQL之间的数据转换问题,REDIS 是典型的KEY -VALUE型NOSQL数据库,并且提供了额外丰富的数据类型. 这里简单列举了标签类型的应用问题. 比如在MySQL里面,对内容的标签有以下简单的几张表,我这里只列出来拆分过后的表结构. 内容表: CREATE TABLE `content` ( `id` int(10) unsigned NOT NULL, -- 内容ID,唯一.

Redis数据“丢失”问题

- - 今天
Redis大部分应用场景是纯缓存服务,请求后端有Primary Storage的组件,如MySQL,HBase;请求Redis的键未命中,会从primary Storage中获取数据返回,同时更新Redis缓存. 如果少量数据丢失,相当于请求”缓冲未命中“; 一般对业务的影响是无感知的. 但现在Redis用作存储的业务场景变多,数据丢失对业务是致命的影响.

mysql 数据分离

- - 数据库 - ITeye博客
网上看到一个读写分离的帖子,感觉不错. 构建高性能web之路------mysql读写分离实战(转). 一个完整的mysql读写分离环境包括以下几个部分:. 在本次实战中,应用程序client基于c3p0连接后端的database proxy. database proxy负责管理client实际访问database的路由策略,采用开源框架amoeba.

浅谈 Redis 与 MySQL 的耦合性以及利用管道完成 MySQL 到 Redis 的高效迁移

- - CSDN博客数据库推荐文章
    ㈠ Redis 与 MySQL 的耦合性.     在业务架构早期、我们便该"吃着碗里的看着锅里的"、切莫让MySQL 有梦、而Redis 无心.     毕竟、有些关系型的结构不适合放到Redis跑、"男女搭配、干活不累"嘛、推荐让MySQL与Redis喜结连理.     其次、这 2 人、一般是在不同场景做选择、而不会在性能上选择、.

mysql突然出现大量慢sql,随后redis访问超时

- - Linux - 操作系统 - ITeye博客
在亚马逊云买了多台的虚拟主机,一年多没有由于系统的原因出过故障. 早上接到报警,从业务故障上来看,应该是数据库没有响应了. SSH连数据库服务器,发现连不上. 重启数据库服务器,一直起不来. 最后用上周的数据库服务器的系统备份snapshot(我们的数据盘和系统盘是分开的)新建一个Volume,替换掉故障系统盘,重新启动服务器,才顺利进入系统.

redis作为mysql的缓存服务器(读写分离)

- - 数据库 - ITeye博客
Redis是一个key-value存储系统. 和Memcached类似,为了保证效率,数据都是缓存在内存中. 区别的是redis会周期性的把更新的数据写入磁盘或者把修改操作写入追加的记录文件,并且在此基础上实现了master-slave(主从)同步. 在部分场合可以对关系数据库起到很好的补充作用. 它提供了Java,C/C++(hiredis),C#,PHP,JavaScript,Perl,Object-C,Python,Ruby等客户端,使用很方便.

Redis数据分片以及扩容

- - NoSQLFan
投稿介绍:xiaotianqio,资深linux菜鸟程序员,搜索系统砖家,曾混迹于百度的互联网吊丝. 刚开始接触 Redis,大言不惭,聊卿一读. 一开始数据比较少,一台服务器的内存就足够,因此一个Redis 就能满足需求,但是随着业务发展,数据量变大,可能需要在多台服务器上运行多个Redis,所以需要将已有的数据进行 分片(避免数据丢失),不同的片交给不同的Redis 服务.