sudongxiang
sudongxiang
不要用稀疏的方式,最好是设定固定输入长度,缺失值设置value为0,index任意即可。
这涉及到tensorflow的原理了,记住,调用方法只是一种手段,你可以在graph里面初始化,效果是一样的。
需要做embedding的,只有离散特征,例如IDs等。了解?
仔细看代码吧,问题不大
因为连续值被离散化了,所有特征都是离散化的。当然,你也可以不设定为1,不必局限于example
i have the same isue ; however, I find that batch_norm is not working for distributed training; so, just disable batch_norm;
小心”未来信息“, 即y在neigh里面。 这样的话,即使训练的再好,线上效果也好不了。@Aliang-CN