日志

票务系统K8S集群部署架构图

虽然k8s集群实现了高可用的能力,但是服务受限于资源目前无法保证高可用,以下情况可能导致服务不可用:
  一、目前工作节点基本内存占用在80%左右,一旦宕机一台短时间未恢复的资源会被转移到其它节点上,且无法完全容纳,需要再加一台工作节点,以保证单点故障不会影响服务正常运行
  二、由于seata,nacos等中间件并未使用外部正式环境mysql数据库,使用的是k8s内部署的mysql,一旦mysql所在的节点宕机将会导致依赖的中间件异常
    方案一:中间件依赖数据库迁移至外部正式环境业务数据库,但是会抢占资源对业务性能有影响
    方案二:k8s部署的mysql数据库做主从同步多机部署,引入中间件(ProxySQL 或 MySQL Router)进行故障转移,不过目前的资源不太能够支持
  三、控制节点连续宕机两台导致etcd无法进行选举

另外Elk,Prometheus相关组件应该抽出来独立建一个高可用稳定的群集,可以同时开放给多个环境与项目统一使用,避免被业务服务压力波动影响。

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注