CAP理论

2017-06-09

CAP理论指对于一个分布式计算系统来说，不可能同时满足以下三点：

CAP理论认为分布式系统最多只能CAP中的两点。

常见的单机数据库如MYSQL不提供分区容忍，属于AP的系统。

而对于近年来比较火热的NOSQL，设计时更多考虑水平扩展（Scale out），大多提供分区容忍。因而要在一致性和可用性之间做出选择。

以Cassandra和HBase为例，Cassandra的P2P模型提供了良好的水平扩展能力，默认提供最终一致性，选择了CAP中的AP。Cassandra也可以配置成强一致性，这时就要失去了CAP中的可用性A。

而HBase则是常见的主从架构，牺牲了可用性，选择了CP。

CAP理论提出以来，得到了计算机理论界的广泛认可。不过也有不少人指出CAP理论的不足之处。

DANIEL ABADI 在他的博文 Problems with CAP, and Yahoo’s little known NoSQL system指出了三点CAP的不足。

因此他建议使用 PACELC 来替换 CAP：如果发生了网络分区（P），可用性（A）和一致性（C）如何选择，或者（E）在正常情况，延迟（L）和一致性（C）如何取舍。

Dynamo在发生网络分区时，牺牲了一致性（C），选择了可用性（A）。正常情况下，为了降低延迟（L），放弃了强一致性（C）。所以Dynamo是PA/EL。

MYSQL则始终提供强一致性（C），在某些情况下选择性的放弃了可用性（A）和低延迟（L）。所以MYSQL是PC/EC.