nihui
nihui
moltenvk 上游已修复 https://github.com/KhronosGroup/MoltenVK/pull/1635 maxTotalThreadsPerThreadgroup 只在 ios 12 中才有
这个 address=0x8 看起来很像是内存/显存不够,可以试试最新的ncnn,优化了内存占用
we may need `ncnn::get_very_big_cpu_count()`
please fix the ci errors
不要用中文注释,修正代码格式 非关键代码不建议使用移位操作替代乘除法 测试代码写在 tests/test_mat_pixels 里面
todo: apply coding style for mm sources wrap platform specific features with NCNN_PLATFORM_API macro add some tests
emptyCache 看起来就是原来的 clear 嘛?所以直接把 clear 提升到基类也ok? gpu 那边的 VkAllocator 有 clear 方法
copy squeezenet_v1.1.param and squeezenet_v1.1.bin from ncnn/examples to your current working directory
编译参数不应该开启 NCNN_BENCHMARK 和 NCNN_COVERAGE,这两个是调试用的,会输出大量调试信息和文件,影响速度 ```cmake -DCMAKE_BUILD_TYPE=Release -DNCNN_BENCHMARK=OFF -DNCNN_VULKAN=OFF -DNCNN_COVERAGE=OFF -DNCNN_BUILD_EXAMPLES=OFF ..```
ndk r16 应该不支持 armv8.2 fp16,建议更新新版的ndk,或者 `-DNCNN_ARM82=OFF` 编译