guochaorong
guochaorong
对于协议中含有Upgrade的这种http请求 比如Upgrade到websocket协议。
debug时, 可以在teamcity上指定具体模型跑
 http://10.255.100.55:8111/viewLog.html?tab=buildLog&buildTypeId=ContinuousEvaluation_PaddleContinuousEvaluation&buildId=1 请闫旭老师帮忙弄下teamcity agent 的docker中需要一些什么设置~ 机器:10.255.100.55 docker 容器:teamcity-agent 登录方式我单给你下~ 谢谢
 最上面那个任务, 点击进去经常发现只有几个tasks, 将其显示doing状态或者在doing 的不显示在CE web上? 避免用户以为我们只有这几个模型
http://www.celeryproject.org/ teamcity上只支持3个免费agent。 如果将来需要测试若干种机型task, 需要加若干agent才能支持。 调研了celery 工具 ### **流程** master监测到teamcity 上的queue 中有tasks, 执行相应的调度 ```python @app.task def V100(): #Run tasks on v100 return {"task_kpis":"kpis_values", "task_type": "v100"} @app.task def P40(): #Run tasks on...
CE 模型重构
目前一个模型目录中, 所有gpu,cpu场景都配置在里面。 导致其中kpi相关配置,以及model中记录kpi的变量越来越多。 比如: 加一个4卡和8卡 需要把kpi配置, 启动脚本等,都平铺开来。  https://github.com/PaddlePaddle/paddle-ce-latest-kpis/pull/37 随着我们机器型号和模型场景(Gpu单卡、多卡,cpu等)不断扩充, 维护起来比较费劲。 ### 计划进行如下重构: 每一个模型有一个对应的base模型: ```sh resnet50 ``` base模型里存放的内容有: model.py(模型脚本), continuous_evaluation.py (kpi 变量), 所有模型共用。 可以在此基础上定义各种场景模型 ```sh resnet50-p40-card8 resnet50-p40-card4 resnet50-p40-card1 resnet50-v100-card4 resnet50-v100-card1...
1. commit details 和 compare页面不加cache。 如果用户请求了一个commit detail页面后再请求另一个commit detail页面,因为缓存的存在,会导致用户看到的页面信息和实际对不上。 而且这个响应时间本来比较短,可以不加缓存  2. compare 显示的commit id信息,目前没有顺序 计划将新的commit 显示在上面,老commit在下面的顺序排列,方便选择 3. 对于后来加的模型,以及后来模型新加的kpis, 需要判断是否两个commit都有相应的task或kpi,否则会key error  例如,选择两个commit 比较,ce server报错: 
CE db优化
原来CE模型设置的merge监控,模型需要merge到CE模型库才能暴露问题。 本周增加CE 模型repo PR的监控告警。这样能够保证模型在merge到CE模型库之前 是功能正确,并且阈值在范围内. 栗子: https://github.com/Superjomn/paddle-ce-latest-kpis/pull/33 效果如下:  点击"details" http://18.222.34.7:8080/viewLog.html?buildId=450&buildTypeId=Paddle_CeTaskEvaluation
CE模型对齐
CE模型添加多卡支持,待验证Model CE多卡加速比指标