RecSysDatasets icon indicating copy to clipboard operation
RecSysDatasets copied to clipboard

关于你们提供的百度网盘里的gowalla数据集问题

Open Light-lyy opened this issue 3 years ago • 1 comments

在你们提供的百度网盘 https://pan.baidu.com/s/1p51sWMgVFbAaHQmL4aD_-g 里,RecBole>ProcessedDatasets>Gowalla目录下,有两个目录:merged和not_merged。请问这两个东西有什么不同呢?是去重和不去重的区别吗?以及,如果用你们RecBole框架获取gowalla数据集,得到的是其中哪一个呢?

Light-lyy avatar Apr 15 '22 13:04 Light-lyy

@Light-lyy 您好,merged 指合并同一用户/session 对某 item 的重复点击,not-merged 反之。建议序列化推荐用 not-merged,一般序列化推荐不去重的。在RecBole框架下,使用'gowalla-merged' 与 ‘gowalla-not-merged’ 来区分二者。

Ethan-TZ avatar Apr 15 '22 13:04 Ethan-TZ