千家信息网

Galera Cluster大坑的解决方案

发表于:2025-01-20 作者:千家信息网编辑
千家信息网最后更新 2025年01月20日,有些同学在使用Galera Cluster之后,会发现有一些坑,如:1)大表DDL操作会导致整个集群不可用。在DDL操作完成前集群都不可写入任何事务,导致服务不可用。解决方案:直接使用pt-onlin
千家信息网最后更新 2025年01月20日Galera Cluster大坑的解决方案

有些同学在使用Galera Cluster之后,会发现有一些坑,如:
1)大表DDL操作会导致整个集群不可用。在DDL操作完成前集群都不可写入任何事务,导致服务不可用。

解决方案:
直接使用pt-online-schema工具进行操作,可以避开这个问题。

2)由于Galera Cluster在执行DDL时,是Total Ordered Isolation(wsrep_OSU_method=TOI)的,所以必须要保证每个节点都是同时执行的,当然对于不是DDL的,也是Total Order的,因为每一个事务都具有同一个GTID值,DDL也不例外,而DDL涉及到的是表锁,MDL锁(Meta Data Lock),只要在执行过程中,遇到了MDL锁的冲突,所有情况下,都是DDL优先,将所有的使用到这个对象的事务,统统杀死,不管是读事务,还是写事务,被杀的事务都会报出死锁的异常,所以这也是一个Galera Cluster中,关于DDL的闻名遐迩的坑。

解决方案:
可以使用滚动升级方式在每个节点上分别执行DDL操作,这样就可以避开上面的问题。操作如下:

SET wsrep_OSU_method='RSU';

ALTER TABLE test ADD COLUMN user_age tinyint;

SET wsrep_OSU_method='TOI';

即先在节点上修改实例升级方式为滚动升级(Rolling Schema Upgrade),然后再执行DDL语句,最后再将实例升级方式修改回去。

0