RecSysDatasets icon indicating copy to clipboard operation
RecSysDatasets copied to clipboard

知识图谱数据集问题

Open KlaineWei opened this issue 3 years ago • 2 comments

能否提供下将数据集转换成kg文件的脚本?现在只提供了ml,amazonbooks和lfm的已经处理好的kg文件,但是缺少其他数据集

KlaineWei avatar Sep 16 '22 12:09 KlaineWei

@KlaineWei 您好,要获取知识图谱数据集首先需要将物品的 ID 和知识图谱的实体 ID 相对应,RecSysDatasets 中提供的三个知识图谱数据集都是基于 KB4Rec 的实体链接工作,由于没有其他开源的知识图谱 ID 链接文件,所以无法直接获得其他数据集的知识图谱数据。

Sherry-XLL avatar Sep 16 '22 12:09 Sherry-XLL

这里给的lfm1b这个数据集的知识图谱关系太过复杂了,训练太慢,我是否可以暴力截断kg和link文件,减少关系依赖,从而降低训练复杂度

qqqqxun avatar Sep 12 '23 08:09 qqqqxun

@KlaineWei 您好,要获取知识图谱数据集首先需要将物品的 ID 和知识图谱的实体 ID 相对应,RecSysDatasets 中提供的三个知识图谱数据集都是基于 KB4Rec 的实体链接工作,由于没有其他开源的知识图谱 ID 链接文件,所以无法直接获得其他数据集的知识图谱数据。

请问如果自己想通过KB4Rec构造recbole的是数据集,难度大嘛,有没有现成的资料可以学习使用,谢谢

yunshanlucky avatar Apr 28 '24 06:04 yunshanlucky

@yunshanlucky conversion tools里有KG三个数据集的生成代码,可以进行参考

KlaineWei avatar Apr 28 '24 06:04 KlaineWei

@KlaineWei 感谢您的回答,可能由于我基础有限,只能使用官方转换好的3个KG数据集,如果我需要进一步将yelp2018或者last fm数据集转化为KG形式,我需要怎么进行下一步操作,由于网络中学习资源匮乏,能否提供相应的学习资料,或者是详细的数据集转化方法,您的回答对我帮助非常大,再次非常感谢您的回答

yunshanlucky avatar Apr 28 '24 08:04 yunshanlucky