分布式一致性协议之两阶段提交协议(2PC)、三阶段提交协议(3PC)
# 1 两阶段提交协议(2PC)
# 1.1 两阶段提交协议
两阶段提交协议,简称 2PC(2 Prepare Commit),是比较常用的解决分布式事务问题的方式,要么所有参与进程都提交事务,要么都取消事务,即实现 ACID 中的原子性(A)的常用手段。
分布式事务: 事务提供一种操作本地数据库的不可分割的一系列操作 “要么什么都不做,要么做全套(All or Nothing)”的机制,而分布式事务就是为了操作不同数据库的不可分割的一系列操作 “要么什么都不做,要么做全套(All or Nothing)”的机制
# 1.2 2PC 执行流程
# 1.2.1 成功执行事务事务提交流程
阶段一:
事务询问
协调者向所有的参与者发送事务内容,询问是否可以执行事务提交操作,并开始等待各参与者的响应。
执行事务 (写本地的 Undo/Redo 日志)
各参与者向协调者反馈事务询问的响应
阶段二:
发送提交请求:
协调者向所有参与者发出 commit 请求。
事务提交:
参与者收到 commit 请求后,会正式执行事务提交操作,并在完成提交之后释放整个事务执行期间占用的事务资源。
反馈事务提交结果:
参与者在完成事务提交之后,向协调者发送 Ack 信息。
完成事务:
协调者接收到所有参与者反馈的 Ack 信息后,完成事务。
# 1.2.2 中断事务流程
假如任何一个参与者向协调者反馈了 No 响应,或者在等待超时之后,协调者尚无法接收到所有参与者的反馈响应,那么就会中断事务
阶段一:
事务询问
协调者向所有的参与者发送事务内容,询问是否可以执行事务提交操作,并开始等待各参与者的响应。
执行事务 (写本地的 Undo/Redo 日志)
各参与者向协调者反馈事务询问的响应
阶段二:
发送回滚请求: 协调者向所有参与者发出 Rollback 请求。
事务回滚: 参与者接收到 Rollback 请求后,会利用其在阶段一中记录的 Undo 信息来执行事务回滚操作,并在完成回滚之后释放在整个事务执行期间占用的资源。
反馈事务回滚结果:
参与者在完成事务回滚之后,向协调者发送 Ack 信息。
中断事务: 协调者接收到所有参与者反馈的 Ack 信息后,完成事务中断。
# 1.3 2PC 优点缺点
优点
原理简单
缺点
同步阻塞
在二阶段提交的执行过程中,所有参与该事务操作的逻辑都处于阻塞状态,即当参与者占有公共资源时,其他节点访问公共资源会处于阻塞状态
单点问题
若协调器出现问题,那么整个二阶段提交流程将无法运转,若协调者是在阶段二中出现问题时,那么其他参与者将会一直处于锁定事务资源的状态中,而无法继续完成事务操作
数据不一致
在阶段二中,执行事务提交的时候,当协调者向所有的参与者发送 Commit 请求之后,发生了局部网络异常或者是协调者在尚未发送完 Commit 请求之前自身发生了崩溃,导致最终只有部分参与者收到了 Commit 请求,于是会出现数据不一致的现象。
太过保守
在进行事务提交询问的过程中,参与者出现故障而导致协调者始终无法获取到所有参与者的响应信息的话,此时协调者只能依靠自身的超时机制来判断是否需要中断事务,这样的策略过于保守,即没有完善的容错机制,任意一个结点的失败都会导致整个事务的失败。
# 2 三阶段提交协议(3PC)
三阶段提交协议出现背景:一致性协议中设计出了二阶段提交协议(2PC),但是 2PC 设计中还存在缺陷,于是就有了三阶段提交协议,这便是 3PC 的诞生背景。
# 2.1 三阶段提交协议
3PC,全称 “three phase commit”,是 2PC 的改进版,将 2PC 的 “提交事务请求” 过程一分为二,共形成了由CanCommit
、PreCommit
和doCommit
三个阶段组成的事务处理协议。
三阶段提交升级点(基于二阶段):
- 三阶段提交协议引入了超时机制。
- 在第一阶段和第二阶段中,引入了一个准备阶段。保证了在最后提交阶段之前各参与节点的状态是一致的。
简单讲:就是除了引入超时机制之外,3PC 把 2PC 的准备阶段再次一分为二,这样三阶段提交就有 CanCommit
、PreCommit
、DoCommit
三个阶段。
# 2.2 三个阶段详解
# 2.2.1 第一阶段(CanCommit 阶段)
类似于 2PC 的准备(第一)阶段。协调者向参与者发送 CanCommit 请求,参与者如果可以提交就返回 Yes 响应,否则返回 No 响应。
事务询问
协调者向参与者发送 CanCommit 请求。询问是否可以执行事务提交操作。然后开始等待参与者的响应。
响应反馈:
参与者接到 CanCommit 请求之后,正常情况下, 如果其自身认为可以顺利执行事务,则返回 Yes 响应,并进入预备状态。 否则反馈 No
# 2.2.2 第二阶段(PreCommit 阶段)
协调者根据参与者的反应情况来决定是否可以执行事务的 PreCommit 操作。根据响应情况,有以下两种可能。
- Yes
(1).发送预提交请求: 协调者向参与者发送 PreCommit 请求,并进入 Prepared 阶段。
(2).事务预提交: 参与者接收到 PreCommit 请求后,会执行事务操作,并将 undo 和 redo 信息记录到事务日志中。
(3).响应反馈: 如果参与者成功的执行了事务操作,则返回 ACK 响应,同时开始等待最终指令。
- NO
假如有任何一个参与者向协调者发送了 No 响应,或者等待超时之后,协调者都没有接到参与者的响应,那么就执行事务的中断。则有:
(1).发送中断请求: 协调者向所有参与者发送 abort 请求。
(2).中断事务: 参与者收到来自协调者的 abort 请求之后(或超时之后,仍未收到协调者的请求),执行事务的中断
# 2.2.3 第三阶段(doCommit 阶段)
该阶段进行真正的事务提交,也可以分为执行提交和中断事务两种情况。
执行成功
(1).发送提交请求: 协调者接收到参与者发送的 ACK 响应,那么它将从预提交状态进入到提交状态。 并向所有参与者发送 doCommit 请求。
(2).事务提交: 参与者接收到 doCommit 请求之后,执行正式的事务提交。 并在完成事务提交之后释放所有事务资源。
(3).响应反馈: 事务提交完之后,向协调者发送 ACK 响应。
(4).完成事务: 协调者接收到所有参与者的 ACK 响应之后,完成事务。
中断事务
(1).发送中断请求: 协调者向所有参与者发送 abort 请求
(2).事务回滚: 参与者接收到 abort 请求之后,利用其在阶段二记录的 undo 信息来执行事务的回滚操作, 并在完成回滚之后释放所有的事务资源。
(3).反馈结果: 参与者完成事务回滚之后,向协调者发送 ACK 消息
(4).中断事务: 协调者接收到所有参与者反馈的 ACK 消息之后,执行事务的中断。
# 2.2.4 注意:一旦进入阶段三,可能会出现 2 种故障:
协调者出现问题
协调者和参与者之间的网络故障
如果出现了任一一种情况,最终都会导致参与者无法收到 doCommit 请求或者 abort 请求,针对这种情况,参与者都会在等待超时之后,继续进行事务提交
# 2.3 2PC 对比 3PC
首先对于协调者和参与者都设置了超时机制(在 2PC 中,只有协调者拥有超时机制,即如果在一定时间内没有收到参与者的消息则默认失败),主要是避免了参与者在长时间无法与协调者节点通讯 (协调者挂掉了)的情况下,无法释放资源的问题,因为参与者自身拥有超时机制会在超时后,自动进行本地 commit 从而进行释放资源。而这种机制也侧面降低了整个事务的阻塞时间和范围。
通过 CanCommit、PreCommit、DoCommit 三个阶段的设计,相较于 2PC 而言,多设置了一个缓冲阶段保证了在最后提交阶段之前各参与节点的状态是一致的 。
PreCommit 是一个缓冲,保证了在最后提交阶段之前各参与节点的状态是一致的。
问题:3PC 协议并没有完全解决数据一致问题。
- 01
- idea 热部署插件 JRebel 安装及破解,不生效问题解决04-10
- 02
- spark中代码的执行位置(Driver or Executer)12-12
- 03
- 大数据技术之 SparkStreaming12-12