PPSite

Results 3 comments of PPSite

> 还有一种场景,是从我们看到的一些大客户、大规模的情况,运维侧的管理人员希望变动是一致的,他们看到的都是标准的基础设施单元,如果只针对新增节点,那当集群规模达到上千,这期间累计 N 次集群扩容及配置变更,那对于他们管理侧是管理的极大风险 假如集群有 1000 台机器,现在要新增 50 台,为保证标准化基础设施,新增50 台节点时就要在 1000 台机器上再执行一遍;这显然不合适;维护机器只新增 1 台的情况呢? 有两种解决办法: 1. 配置标准化由管理员确保一致性; 2. 把配置标准化动作从新增节点动作中抽离出来,作为独立功能;

反馈个新情况: 为应对紧急情况,趁集群正常新增加一个节点,一切初始化完成再关机做资源储备; 新增节点成功后,其中一个旧节点 NodeReady,导致批量容器迁移; 排查异常发现该节点 haproxy 未启动,没来得及看源码找 haproxy 具体的启动命令,最后重启整个节点恢复异常; 目前清楚这个状况是否可以复现,但这显然是在旧节点上执行初始化带来的异常;