分布式领域CAP理论

  • Consistency(一致性), 数据一致更新, 所有数据变动都是同步的
  • Availability(可用性), 好的响应性能
  • Partition tolerance(分区容忍性), 可靠性

定理

任何分布式系统只可同时满足二点,没法三者兼顾。

不要将精力浪费在如何设计能满足三者的完美分布式系统,而是应该相应的取舍。

ACID模型

关系数据库的ACID模型拥有高一致性 + 可用性 ,但是很难进行分区:

  • Atomicity 原子性:一个事务中所有操作都必须全部完成,要么全部不完成。
  • Consistency 一致性: 在事务开始或结束时,数据库应该在一致状态。
  • Isolation 隔离性:事务将假定只有它自己在操作数据库,彼此不知晓。
  • Durability:耐久性,一旦事务完成,就不能返回。

跨数据库两段提交事务:2PC (two-phase commit), 2PC is the anti-scalability pattern (Pat Helland) 是 反可伸缩模式 的,JavaEE中的JTA事务可以支持2PC。因为2PC是反模式,尽量不要使用2PC,使用 BASE 来回避。

BASE模型

BASE模型反ACID模型,完全不同ACID模型,牺牲高一致性,获得可用性或可靠性:

  • Basically Available 基本可用, 支持分区失败(e.g. sharding碎片划分数据库)
  • Soft state 软状态, 状态可以有一段时间不同步,异步。
  • Eventually consistent 最终一致, 最终数据是一致的就可以了, 而不是时时高一致。

BASE思想的主要实现有

  • 按功能划分数据库
  • Sharding 分片

BASE思想主要强调基本的可用性,如果你需要很高的可用性,也就是纯粹的高性能,那么就要以一致性或容忍性为牺牲,BASE思想的方案在性能上还是有潜力可挖的。