CTR_Algorithm issues

关于DIEN的PyTorch实现

1

你好，我在阅读DIEN的PyTorch代码时发现一个地方可能存在错误在Interest Extractor Layer中，GRU的隐藏层应该保留前T-1个用于计算辅助loss 但是DIEN代码的152行是 `gru_embed=pad_interests[:,1:]` 这样是不是取了后T-1个hidden state? 我理解的应该是 `gru_embed=pad_interests[:,:-1]`

Q-Qing

关于DIN模型的疑惑

4

大佬您好，最近看您的DIN代码，有一些地方不太明白，希望得到您的解答！ 1、mask = (behaviors_x > 0).float().unsqueeze(-1) 这里的msak的具体作用是啥啊？为什么需要这个mask呢？这里的注意力输入部分，原始的好像没有queries - user_behavior吧？为啥有这一项呢 2、attn_input = torch.cat([queries, user_behavior, queries - user_behavior, queries * user_behavior], dim = -1) 3、 output = user_behavior.mul(attns.mul(mask)) # batch...

yanduoduan

模型中编码问题

2

DeepFM中的编码是采用的one-hot编码方式，作者在此处用了lable编码方式。这种编码方式很少用，且局限性很强。这种编码方式确实在embedding的时候非常方便。但是这种编码方式最后产生的实际效果是不是可信度不强呢

Museens

模型中关于输入的feature_fields的疑惑

6

大佬，您好，您写的这个项目是我看到最优美的推荐代码，对于小白的我，非常受益，感谢您把您的工作分享出来，供大家学习。在阅读代码的时候，我一直有一个小小的疑惑，就是，fields = data_x.max().values，这句话的意思是获取到每列特征中最大的索引，比如第一列是0，1两个不同的特征，而这句代码直接就取到了1，然而实际就有两个不同的特征，这样做embedding的时候，每一列的特征都少一个，所以torch.nn.Embedding(sum(feature_fields)+1,1)是不是应该为torch.nn.Embedding(sum(feature_fields+1),1)？还有为什么要在sum(feature_fields)后面加个1呢？还请大佬明示，感谢！

yanduoduan

模型中offset的问题

2

大佬，请问一下模型中对输入加上一个offset 有什么作用呢，为啥offset还要向右偏移了一位呢？初次学习，还请大佬指教，感谢！

AI-rcl

请问，Pytorch版本的xDeepFM怎么跑不通啊

2

wobushitietouwawa

关于亚马逊数据行为序列截取的疑问

首先非常感谢您提供的优雅的代码关于AmazonBookPreprocess.py文件中对用户行为序列的截取代码，您定义为： def trim_cate_list(x): if len(x) > seq_len: #历史行为大于40, 截取后40个行为 return pd.Series(x[-seq_len:], index = cols) else: #历史行为不足40, padding到40个行为 pad_len = seq_len - len(x) x = x + ['0'] * pad_len...

wangelyn

CTR_Algorithm
CTR_Algorithm copied to clipboard

Metadata

关于DIEN的PyTorch实现

关于DIN模型的疑惑

模型中编码问题

模型中关于输入的feature_fields的疑惑

模型中offset的问题

请问，Pytorch版本的xDeepFM怎么跑不通啊

关于亚马逊数据行为序列截取的疑问

← Metadata

Owner

Metadata

CTR_Algorithm CTR_Algorithm copied to clipboard

Metadata

关于DIEN的PyTorch实现

关于DIN模型的疑惑

模型中编码问题

模型中关于输入的feature_fields的疑惑

模型中offset的问题

请问，Pytorch版本的xDeepFM怎么跑不通啊

关于亚马逊数据行为序列截取的疑问

← Metadata

Owner

Metadata

CTR_Algorithm
CTR_Algorithm copied to clipboard