ddongchen
ddongchen
代码中有内置的干扰检测代码和部分内测资源,包括节点资源、容器资源和app级别的资源,其中app级别的资源支持外部扩展,可以直接用,满足日常干扰检测需求。 目前正在扩展更灵活的检测插件和更多资源
@mrningyang 离线调度器开源正在准备中。
> > @mrningyang 离线调度器开源正在准备中。 > > @ddongchen 预计什么时间开源呀 hi, @mrningyang 离线调度器开源还在规划中,确定后我们会第一时间通知你~
> 请教下离线作业在yarn上,not on k8s,是不是可以不用部署lighthouse和plugin server lighthouse和plugin server是通过拦截方式加强离线容器启动的隔离性,离线作业在yarn上运行,yarn的nm是通过k8s pod部署,也需要这两个组件。
> > > 请教下离线作业在yarn上,not on k8s,是不是可以不用部署lighthouse和plugin server > > > > > > lighthouse和plugin server是通过拦截方式加强离线容器启动的隔离性,离线作业在yarn上运行,yarn的nm是通过k8s pod部署,也需要这两个组件。 > > 多谢,还想请教下自定义的服务指标,比如qps,rule check需要怎么配置呢? 自定义的服务指标可参考https://github.com/Tencent/caelus/blob/master/doc/config.md#8online 目前是配置在app模块里。这块正在考虑单独拿出来,扩展性更强。
> > > > 好的,“在线作业非运行在K8s平台相关配置”这句话看起来是配置的是online_type:local类型的在线作业,online_type:k8s同样也可以配置指标是吧? 是的。若在线作业为非k8s,即直接裸机部署进程,则online_type:local。若在线通过k8s提交,则online_type:k8
这是哪的报错? 不需要安装crd > no kind "hookConfiguration" hookConfiguration crd是怎么装上的啊
> 传递的node名称是否对? 确认下kubectl get node 获取的node名称和caelus要寻找的node名称是否一致
日志报错not found,并打印node的内容,里面没有发现node的名称。 这个是node名称?
可查看Readme。特别详细的原理说明文档,还在完善中,目前可通过分析代码,了解整个流程