AlbusWei
AlbusWei
DPIN(https://arxiv.org/abs/2106.05482 )并没有开源数据集和代码,在比赛任务页面也并没有提供相关资料,而任务要求为“按照论文数据,预计以DIN模型作为对比,AUC获得性能提升复现后合入PaddleRec套件,并添加TIPC”,请问在哪里获取相关数据集?或者使用什么公共数据集(因为引入了位置信息,一般的公共数据集并不适用这个任务)。
ali-ccp文件夹下,data_process.sh文件里面有一行 python reader.py --train_data_path ${train_target_path} \ --test_data_path ${test_target_path} \ --vocab_path vocab/vocab_size.txt \ --train_sample_size 6400 \ --test_sample_size 6400 \ 但是ali-ccp文件夹下没有reader.py文件,而使用run.sh下载的10m数据集复现不了文档中说的效果,auc停留在0.5x 想要下载全量数据,但是没有reader,也无法反推数据处理的方式