Results 9 comments of keith

mobilefacenet.param里面已经做了substract_mean_normalize,应该不用再归一化一次吧

@Grzego Thanks for sharing,looking forward to a Chinese version!

@Simon-Duan 训练中文是每个中文字作为一个标签输入,请问一下训练英文是整个英文单词作为一个标签训练还是把一个单词中的每个字母分开为多个标签训练?

@Simon-Duan 好的~感谢,迷了一下午了,毕竟单词级量太大了不现实。btw,如果是每个字母训练对于长句子存在多个单词的识别出来的情况该怎么分词和区分空白间隔呢,空白估计要喂一些数据进去训练~

对于你这个问题,__shlf_down函数的问题,你试一下将Makefile.config里面的sm_20和sm_21那两行注释掉?我这只是猜测,你看看这两个帖子。 http://stackoverflow.com/questions/29963442/shuffle-instruction-in-cuda

@Jeremyliu7 你英文训练的label是按单词丢进去的吗?我以为是把单词分割成单个字母作为多训练标签丢进去呢。

请问有训练好的英文模型吗?谢谢。 @senlinuc

@rabbithui 我和你一样也是改成37,loss一直是26不往下降~请问你解决了吗?,谢谢

> I managed to create a json file which works. Here is the example I come up with: > > { > "d_model": 160, > "h": 8, > "attn_type": "entmax15",...