toad icon indicating copy to clipboard operation
toad copied to clipboard

question

Open houxiaosen opened this issue 2 years ago • 2 comments

你好,作者大大,能否给出quality计算IV的详细计算过程吗?我在做计算的时候发现全为空值的一列字段仍有属于它的IV值,在我理解看来尽管缺失值可以作为一箱,但某一列全为缺失值的IV仅有一箱的情况下不是应该等于零吗

houxiaosen avatar Dec 14 '23 07:12 houxiaosen

@houxiaosen IV的计算公式就是定义的公式 $IV = (P_y - P_n) * ln(P_y / P_n)$,对于全是同一个值的特征来说,只要你的Y中的 1 和 0 的比例不是 50:50,IV就不是0,此时的IV相当于你采样这波数据的IV值。

Secbone avatar Dec 17 '23 15:12 Secbone

作者你好,我的理解是 Py = good/good.sum() pn=bad/bad.sum() 只有一箱的话 py=1, pn=1,IV不应该等于零吗

houxiaosen avatar Dec 28 '23 08:12 houxiaosen