数据库架构设计

数据库架构设计是针对海量数据的数据库，通过数据结构、存储形式和部署方式等方面的规划和设计，以解决数据库服务的高并发、高可用、一致性、可扩展以及性能优化等问题。

一、可用性设计

可用性是指在某个考察时间，系统能够正常运行的概率或时间占有率的期望值。通常，我们都要求某个系统具备“高可用性”。

所谓 “高可用性”（High Availability）是指系统经过专门的设计，从而减少停工时间，保持其服务的高度可用。

数据库的高可用，通常采用的解决方式为：复制+冗余。

1. 保证 “读” 高可用的方法

数据库主从复制，冗余数据。如图所示：

数据库主从复制，冗余数据

主库用于写数据，从库用于读数据。在一主多从的数据库架构中，多份从库数据保证了读数据高可用。

数据库主从复制可能带来的问题：主从数据不一致。

2. 保证 “写” 高可用的方法

双主模式，即复制主库，冗余数据。如图所示：

双主模式，复制主库，冗余数据

很多公司采用单主模式，这是无法保证数据库写的高可用性。

数据库双主模式可能带来的问题：双主同步 key 冲突，引起数据不一致。

解决方案：

a）方案一：由数据库或者业务层保证 key 在两个主库上不冲突。

b）方案二：“双主” 当 “主从” 用，不做读写分离，当主库挂掉时，启用从库。如图下图：

优点：读写都到主，解决了一致性问题；“双主”当“主从”用，解决了可用性问题

带来的问题：读性能如何扩充？解决方案见下文

二、读性能设计：如何扩展读性能

1. 建立索引

建立太多的索引，会带来以下问题：

a）降低了写性能。
b）索引占用内存多了，内存存放的数据就会减少，数据命中率降低，IO次数随之增加。

对于索引过多的问题，有以下解决方案：

不同的库可以建立不同索引。
主库只提供写，不建立索引。

建立索引

online 从库只提供 online 读，建立 online 读索引。

offline 从库只提供 offline 读，建立 offline 读索引。

2. 增加从库

增加从库会引发主从不一致问题，从库越多，主从时延越长，不一致问题越严重。这种方案很常见，但我们在生产环境中没有采用。

增加从库

3. 增加缓存

传统缓存的使用方案：

a）发生写请求时，先淘汰缓存，再写数据库。
b）发生读请求时，先读缓存，hit则返回，miss则读数据库并将数据入缓存（此时可能旧数据入缓存）。

建立索引

增加缓存会带来的两个问题：

a）数据复制会引发一致性问题，由于主从延时的存在，可能引发缓存与数据库数据不一致。
b）业务层要关注缓存，无法屏蔽“主+从+缓存”的复杂性。

我们缓存的使用方案：

服务+数据+缓存。

服务+数据+缓存

这种方案带来的好处：

a）引入服务层屏蔽“数据库+缓存”
b）不做读写分离，读写都到主的模式，不会引发不一致

三、一致性设计

1. 主从不一致的解决方案

a）方案一：引入中间件

主从不一致的解决方案

中间件将key上的写路由到主，在一定时间范围内（主从同步完成的经验时间），该key上的读也路由到主库。

b）方案二：读写都到主

主从不一致的解决方案

我们采用的方案，不做读写分离，数据不会不一致。

2. 数据库与缓存不一致的解决方案

两次淘汰法：

两次淘汰法

异常的读写时序，或导致旧数据入缓存，一次淘汰不够，要进行二次淘汰。

a）发生写请求时，先淘汰缓存，再写数据库，额外增加一个timer，一定时间（主从同步完成的经验时间）后再次淘汰。
b）发生读请求时，先读缓存，hit则返回，miss则读数据库并将数据入缓存（此时可能旧数据入缓存，但会被二次淘汰淘汰掉，最终不会引发不一致）。

架构设计