Partition及Propagate原理

2017-03-08 11:51:24   0  举报





仅支持查看

Partition和Propagate是分布式系统中常用的两种一致性算法。Partition原理是将数据分成多个分区，每个分区独立运行，当分区之间出现数据不一致时，通过重新分配数据来解决。Propagate原理是通过消息传递来保证一致性，当一个节点更新数据时，会将更新操作发送给其他节点，让其他节点也进行相应的更新，从而保证数据的一致性。这两种算法都有其优缺点，需要根据具体场景选择合适的算法来实现一致性。

模板推荐

作者其他创作

大纲/内容

Leader

将消息写入本地Log

ACK

Follower从Leader那里Pull数据

发送请求寻找PartitionLeader

Leader收到ISR系统中所有Follower的ACK包后认为该消息已经commit了

Producer

Follower将数据写入本地Log

Topic

Replication机制的引入：在没有Replication的情况下，一旦某机器宕机或者某个Broker停止工作则会造成整个系统的可用性降低。随着集群规模的增加，整个集群中出现该类异常的几率大大增加，因此对于生产系统而言Replication机制的引入非常重要；引入replica，需要保证同一个Partition的多个Replica之间的数据一致性和有序性。1. Kafka尽量将所有Partition均匀分配到整个集群上。典型的部署方式是一个Topic的Partition数量等于Broker的数量。2. 同时为了提高Kafka的容错恩呢管理，需要将同一个Partition的Replica分散到不同的机器。

Partition 1

Propagate消息时序图:

Replica 3

Replica N

(N =1)

Replica 2

向Topic发送消息时序图

Follower

Push数据到Partition的Replica 3

返回Partition的LeaderReplica 3

Partition

Partition N