plato icon indicating copy to clipboard operation
plato copied to clipboard

多次执行lpa算法的结果不一致

Open yangyi423 opened this issue 4 years ago • 4 comments

3000万数据 在集群模式下运行 每次的结果都不一致,这是什么问题导致的呀?

yangyi423 avatar Mar 10 '21 07:03 yangyi423

lpa,指的是标签传播算法(Label Propagation Algorithm),在计算过程中,节点会将自己的标签更新为邻居中标签数量最多的标签,如果邻居中有多个标签的数量相同,那么就随机选一个标签作为自己的标签,正是这个随机选择,导致了lpa可能每次计算的结果都不一样。

jsycdut avatar Mar 12 '21 02:03 jsycdut

并且这个和你的数据量是无关的,算法早已决定了它具有每次计算结果都不一致的特点(或者说缺点)

jsycdut avatar Mar 12 '21 02:03 jsycdut

另外就是可以查看一下每次根据标签划分的顶点集合差异大不大

actcwlf avatar Mar 12 '21 02:03 actcwlf

lpa算法是不确定的,可以看一下lpa的相关文献。

abasi20 avatar Nov 02 '21 08:11 abasi20