yzds

Results 15 comments of yzds

你好,可以补充一下关键的代码片段吗?便于复现问题

https://www.megengine.org.cn/doc/master/zh/reference/api/megengine.functional.nn.interpolate.html?highlight=align_corners%20true#megengine.functional.nn.interpolate `align_corners=True`是用于设定resize的时候是否中心点对齐

看上去是权限问题,可能需要root权限

啊, 是我看错了,你这是要在adreno730上采样呀,当前只支持adreno6xx系列的adreno,adreno7xx的pmu event list在开源世界里找不到,没法加支持

一般只认为当前性能数据中TMA占比最高的为性能瓶颈,贪心地降低占比最高的那一项。 如果是Bad_Speculation占比高,可以考虑减少分支判断,减少分支预测失败,过程中可以观察Metric_BR_Mispred_Ratio的数值是否能按预期下降

可能是没有PMU event的采样权限,如果能切换root用户可以用root试试,或者看有没有权限修改/proc/sys/kernel/perf_event_paranoid里面的值为-1

抱歉,估计是当初算的人没有拿到测试手机上准确的L1 cache size,不可考证了。这里出入没有特别大,因为文档没说清楚还需要考虑sizeof(dtype),测试用的float数据类型,所以还需要除以4

请问是android平台吗?这种是event系统调用的访问权限问题,可以尝试 echo -1 > /proc/sys/kernel/perf_event_paranoid

或者检查一下/sys/bus/event_source/devices目录下有没有类似armv8_pmuv3这样的cpu pmu文件夹,因为有些嵌入式开发板上面就没有cpu pmu,所以自然就fail了

问题是不是说,你有在非android aarch64的嵌入式设备上编译运行mperf的需求?