duzp111
duzp111
### Description 很多情况下只是某个租户出现异常,这时再进行集群级别的分析和信息收集比较浪费时间,我们只会关系租户问题能否解决。
### Describe your use case 因为内核参数配置导致集群出现问题,通过一键巡检很难快速定位原因。大部分告警级别都是warning,很难从中筛选出关键配置项。  ### Describe the solution you'd like 某些关键的内核参数如果配置有误,设置较高的告警级别,方便快速定位,告警信息可以给出此配置项对集群的影响。 ### Describe alternatives you've considered _No response_ ### Additional context _No response_
### Description 有时,我们仅希望针对某个特定租户进行问题排查,但当前的系统粒度仅停留在集群级别,这导致了排查过程缺乏足够的针对性。
### Description 社区问答:https://ask.oceanbase.com/t/topic/35609687 在集群卡合并的根因分析中增强信息收集,提升问题解决的效率与质量 增加以下信息的收集:目前合并状态、当前存在多少tablet合并卡住、合并进度中的tablet或者长时间未完成的tablet、tablet基本合并进度
### Description 4.2.1.1表的检查逻辑在后续的版本做了修改。合并场景下,有些在bp1创建成功的表,升级到bp10时校验失败,导致合并卡住。 这种情况下,如何使用obdiag进行排查分析。