千家信息网

Greenplum--FTS故障检测原理

发表于:2025-01-23 作者:千家信息网编辑
千家信息网最后更新 2025年01月23日,前言FTS(Fault Tolerance Serve)是GreenPlum中的故障检测服务,是保证GP高可用的核心功能。GreenPlum的Segment的健康检测及HA是由GP Master实现的
千家信息网最后更新 2025年01月23日Greenplum--FTS故障检测原理

前言

FTS(Fault Tolerance Serve)是GreenPlum中的故障检测服务,是保证GP高可用的核心功能。GreenPlum的Segment的健康检测及HA是由GP Master实现的,GP Master上面有个专门的进程-FTS进程,它可以快速检测到Primary或者Mirror是否挂掉,并及时作出Primary/Mirror 故障切换。

一、FTS架构

GreenPlum的Segment的健康检测及HA是由GP Master实现的,GP Master上面有个专门的进程-FTS进程,它可以快速检测到Primary或者Mirror是否挂掉,并及时作出Primary/Mirror 故障切换。如果FTS挂掉了,Master将会重新fork出来一个FTS进程。

二、FTS实现原理

GP Master上面的FTS进程每隔60s(时间可以配置)向Primary或者Mirror发送心跳包,Primary和Mirror收到心跳包后返回它们的当前状态,FTS进程心跳包的发送状态和Segment返回状态更新元信息和作出故障切换。因为Segment可能很多,为了加快检测速度,FTS是多线程的,默认16个线程。

三、Segment检测及故障切换

GP Master首先会检测Primary状态,如果Primary不可连通,那么将会检测Mirror状态,Primary/Mirror状态总共有4种:
Primary活着,Mirror活着。GP Master探测Primary成功之后直接返回,进行下一个Segment检测;
Primary活着,Mirror挂了。GP Master探测Primary成功之后,通过Primary返回的状态得知Mirror挂掉了(Mirror挂掉之后,Primary将会探测到,将自己变成ChangeTracking模式),这时候更新Master元信息,进行下一个Segment检测;
Primary挂了,Mirror活着。GP Master探测Primary失败之后探测Mirror,发现Mirror是活着,这时候更新Master上面的元信息,同时使Mirror接管Primary(故障切换),进行下一个Segment检测;
Primary挂了,Mirror挂了。GP Master探测Primary失败之后探测Mirror,Mirror也是挂了,直到重试最大值,结束这个Segment的探测,也不更新Master元信息了,进行下一个Segment检测。

四、参数配置

4.1、gp_fts_probe_threadcount

用来故障检测的线程数量,默认为16。

4.2、gp_fts_probe_interval

两次检测的时间间隔,默认为60s。如果一次检测时间使用10s,那么剩余50s将会sleep;如果超过60s,将会直接进入下一次检测。

4.3、gp_fts_probe_timeout

检测Segment超时时间,默认值: 20。

4.4、gp_fts_probe_retries

检测Segment失败重试次数,如果超过这个次数,将会认为当前节点挂掉,默认值: 5。

4.5、gp_segment_connect_timeout

Prmary和Mirror文件同步允许连接Mirror最大超时时间,如果达到这个超时时间,Primary将会认为Mirror挂掉了,默认值: 180s。

五、总结

通过GreenPlum FTS机制学习,可以了解部分MPP架构高可用原理。同时根据自身的业务,合理地配置FTS参数,保障GP高可用。

检测 探测 故障 状态 进程 时间 切换 信息 更新 线程 配置 原理 最大 健康 成功 参数 同时 是由 架构 次数 数据库的安全要保护哪些东西 数据库安全各自的含义是什么 生产安全数据库录入 数据库的安全性及管理 数据库安全策略包含哪些 海淀数据库安全审计系统 建立农村房屋安全信息数据库 易用的数据库客户端支持安全管理 连接数据库失败ssl安全错误 数据库的锁怎样保障安全 北仑计算机软件开发工具 2015日本网络安全战略 进程导致db服务器宕机 服务器里怎么找到服务管理器 软件开发的功能周期包括 卫健委网络安全行业需求 软件开发的报表是什么 书店管理系统数据库 五百台电脑服务器配置 boss直聘网络安全审查结果 网络软件开发技术合同模板 云服务器管理申请注册 做一个服务器要用哪些 计算机网络技术基础第5版 计算机网络技术特色班 计算机网络安全技术论文结尾 档案管理系统服务器存储器大小 网络安全法的主要目 无锡dsp软件开发 怎么用手机玩方舟生存进化服务器 甘肃服务器机柜批发虚拟主机 网络安全领导之间责任书 常州互联网软件开发销售价格 数据库表怎么查页面功能模块 计算机网络技术工程系统 网络安全意识观后感心得体会 网络安全服务资质证书 网络服务器验证 软件开发文科生学什么样 朋友网络安全犯罪保释
0