Squeeze icon indicating copy to clipboard operation
Squeeze copied to clipboard

在第(1)步不是已经找到异常值,为什么把满足deviation-score所有点进行聚类?

Open iamsuarez opened this issue 2 years ago • 0 comments

您好,大佬,有个疑问,想请教您下,若您有空了,请回复下,谢谢!疑问如下: cluster_list = list( [list( filter(lambda x: np.min(self.leaf_deviation_score[]) <= self.leaf_deviation_score[x] <= np.max( self.leaf_deviation_score[]), np.arange(len(self._f))) ) for _ in cluster_list] ) 在整个数据集中,若满足deviation-score的点,都会进入类中。这样做的理论是什么? 若这样子做非常好,个人感觉那倒不如直接在第1步就用deviation-score而不是偏差? 个人感觉去掉再聚类这一步(去掉上面代码),是不是更好些?这样完全是根据第一步的偏差以及第二步的deviation-score来判断叶子节点是否是异常(找出从哪些点出发,去找事件的根因)。 麻烦作者,给出解释,谢谢!

iamsuarez avatar Apr 06 '23 08:04 iamsuarez