DefTruth comments

Results 256 comments of


                                            DefTruth

8线程，使用cpu推理，约0.5s一帧，使用GPU推理，约0.15s一帧，请问这个速度正常吗，感觉比原版python的慢好多

> > #15 看这个讨论，可能是由于cpu数据传输的原因 > > 您好，大佬想请教一下，作者原文RVM 在4k视频可以达到76fps，我想在3090上达到最快速度推理，基于咱们这个库如何改进呢，这里推理包括数据加载方式、数据预处理以及模型推理得到输出值alpha、fgr，不包含后续合成在服务端的话，感觉不是很有必要用c++，可以看我fork的分支，里面有个python的推理： * https://github.com/DefTruth/RobustVideoMatting/blob/onnx/inference_onnx.py 需要用到onnxruntime的gpu版本，并且做好iobinding，onnxruntime-gpu python服务端的配置可以看我写的文章： * [👋解决: ONNXRuntime(Python) GPU 部署配置记录](https://zhuanlan.zhihu.com/p/457484536) 如果你想用c++版本，我具体也没试过做这些优化，业余精力有限，主要还是在研究算法本身。但是你可以从2点入手： * 1. 优化rxi的数据传递，如果是onnxruntime，可以尝试做c++版本的iobinding, 可以看官方文档[tune-performance](https://onnxruntime.ai/docs/performance/tune-performance.html) 进行性能调优 * 2. 如果是用MNN，那么可以尝试把rxi设置成device的张量，避免device->host->device的拷贝（我没有尝试过）

DefTruth

8线程，使用cpu推理，约0.5s一帧，使用GPU推理，约0.15s一帧，请问这个速度正常吗，感觉比原版python的慢好多

8线程，使用cpu推理，约0.5s一帧，使用GPU推理，约0.15s一帧，请问这个速度正常吗，感觉比原版python的慢好多

mac m1 编译失败

可以生成exe程序吗

我从代码里只看到对rxi_tensor的复制，没看到使用。

我从代码里只看到对rxi_tensor的复制，没看到使用。

我从代码里只看到对rxi_tensor的复制，没看到使用。

YOLO7什么时候支持

YOLO7什么时候支持

编译onnxruntime一直报错卡在这里了