滑窗法中节假日提取特征的疑问
你好,你曾经分享过视频,对视频中的滑窗法有点疑问:
如图:
- 在Dataset1的“标签区间”含有5月1号劳动节,假如节日对目标变量有关系的话,是否应该创建一个特征叫 is_holiday,
- 与上一个问题差不多,在Dataset2的“特征区间”含有含有5月1号劳动节,假如节日对目标变量有关系的话,那么这种情况该如何处理呢,
谢谢
@176coding 你好,我想问下,你说的这个视频的链接有吗?
@176coding @jason7282 @wepe 你好,我想问下,可以分享一下这个视频的链接有吗?
同问啊?视频哪里有分享的?
https://tianchi.aliyun.com/video.htm?spm=5176.100258.100258.3.1O7LLR
感觉利用划窗法,在划分数据集按时间划分,其中5.1节假日前后只有一段时间,要不测试集没有,要不训练集没有。像视频所说最好使用去年5月份同比。
什么时候用滑窗法?什么时候用交叉验证法呢?
从代码逻辑来看,extract_feature.py中的滑窗法 应该和我以前做过的不太一样 这里发表一下 不知道理解的逻辑是否有误。这题因为不是时间序列问题,所以实际构造的滑窗是前面一段较长时间分析的特征+后一个月的时间(即this_month系列特征),而不是前面一个时间段的窗内数据做x,后一个作y这种形式。