ivoxx
ivoxx
阈值组合[0.8,0.8,0.98] 量化组合 | WiderFace mAP | P-R-O | 0.669 | P(int8)-R-O | 0.493 | P-R(int8)-O | 0.245 | P(int8)-R(int8)-O | 0.158 | 对于检测网络的量化,怎么才能尽量减少精度丢失呢?
Does it support NVIDIA TensorRT? 1. inside container cannot read tensorrt engine which generate from same deivce and cuda version ,shows [TensorRT] WARNING: using an engine plan file across different...
which annotation tool is used for video text tracking?
作者你好,SVTR是个很棒的识别模型!我现在有个任务需要识别比较长的文本,输入长度改变要改哪些模型结构?我现在将svtr输入尺寸改为[32,768],out_char_num也改为了96,发现训练收敛较慢,是否还需要改其他配置?如果需要,要改哪些模型结构配置?
where to download pretrained FPN101 torch model
FOTS中文数据训练实践
1、首先将LSTM隐藏层数设置为256(1024的话,参数量会很夸张)。 2、检查训练图像预处理是否与自己的数据兼容。 3、先训练识别网络,得到骨干网及识别分枝的预训练模型。 4、更改网络结构,使检测和识别使用同一个骨干网,再利用3步的预训练模型进行联合训练。 5、EAST检测分枝,由于算法自身的限制,无法处理好长文本。如果想改善,可以把检测分枝更换为其他能够处理长文本的检测模型。 如果有中文端到端的问题,可以在这里进行讨论。
在ncnn中跑了下,pnet比原版pnet要慢很多,看了下结构,pnet中有3个batchnorm,感觉会降低速度,为什么要这么设计pnet?