Yongchun Zhu
Yongchun Zhu
这个参数随便设置的,你取得更大肯定更容易得到更好的结果,但是取得小跑的更快。
嗯,公司数据无法提供
@marwa7mdi Tencent Look-alike Dataset is available, but I cannot provide the WeChat Dataset.
 I have provided the processed dataset.
google云盘空间满了我就删了,你去腾讯广告大赛官网下载数据吧,用处理数据那个文件处理一下。
我们课题组服务器刷机了,我现在没有风格提取的代码,抱歉
现在这个数据集就是处理过的,解压之后能直接跑程序
1.参考pickle库,代码里也有示范如何用pickle打开 2.代码里有把token转index的部分
简单的做法,读取pkl,遍历每一条样本,转json格式,保存json
好像是pytorch1.6,显卡V100