cola icon indicating copy to clipboard operation
cola copied to clipboard

分布式爬取中,worker的主备mq同步问题

Open tottilin opened this issue 9 years ago • 0 comments

分布式爬取中,worker的主备mq同步问题,目前缺少主备同步机制,也就是说在主正常运行过程中,备一直接收url或者bundle放在mq中,一旦主worker挂了,备又会把主之前跑过的url或者bundle执行一遍。这样会比较耗时,可以做一个定时同步机制,这样备中的数据不会有很多冗余

tottilin avatar Aug 09 '16 03:08 tottilin