gpu-manager icon indicating copy to clipboard operation
gpu-manager copied to clipboard

为什么gpu服务分配了充足资源之后,峰值最大63%,但是多pod共享一张卡之后,峰值却能到90%多?

Open zxt620 opened this issue 5 years ago • 5 comments

实验过程: 1.为测试服务务分配整张显卡资源,100cores及40个单位内存(单个显存单位为256MB)。资源使用情况如下: image 2.创建两个测试服务,跑在同一张卡上,Pod1及Pod2均为50cores及10个单位内存(单个显存单位为256MB),Limit值设为60cores。资源使用情况如下: image

zxt620 avatar Jan 29 '21 07:01 zxt620

Which GPU are you using?

xiazhiyi99 avatar Feb 02 '21 08:02 xiazhiyi99

Which GPU are you using?

nvidia p100

zxt620 avatar Feb 02 '21 08:02 zxt620

maybe it is because of GPU difference, hope this will help https://github.com/tkestack/vcuda-controller/issues/12

Which GPU are you using?

nvidia p100

xiazhiyi99 avatar Feb 02 '21 10:02 xiazhiyi99

@zxt620 你好,请问你是如何测量他们的GPU内存与计算资源的使用情况的呢?似乎 nvidia-smi 无法测量

ZinuoCai avatar Apr 01 '21 14:04 ZinuoCai

@zxt620 你好,请问你是如何测量他们的GPU内存与计算资源的使用情况的呢?似乎 nvidia-smi 无法测量

您好,请问您找到衡量vGPU 利用率的方法了吗,我发现nvidia-smi衡量的是时间片内整个GPU的利用率

isyinun avatar Nov 28 '23 02:11 isyinun