代码不完整,无法将流程串起来
请问处理各个shard的数据搬迁FastIndexLoadDataCollector类是怎么执行的,以及ZeusUtils中怎么执行的loadData.sh脚本,用的什么技术?
FastIndexLoadDataCollector是有一个定时任务启动的,由于是内部服务,我没有把相关代码放进项目中,不过你可以任务这个认识是每分钟执行一次 ZeusUtils也是滴滴内部的服务,你可以任务是一个在远端节点上执行脚本的工具
好的,感谢。关于expandfactor参数,代码里最大值是20,这个是基于什么考虑呢,如果改成比如200,会有什么影响吗
Server中定时任务调度是用的xxl-job实现的吗?
好的,感谢。关于expandfactor参数,代码里最大值是20,这个是基于什么考虑呢,如果改成比如200,会有什么影响吗
限制20主要是为了不让reducer任务过多,占用过多资源
Server中定时任务调度是用的xxl-job实现的吗?
调度任务是我们内部自研的
感觉生成了lucene文件并上传到hdfs之后的流程由于有滴滴内部的诸多服务的原因,导致代码有点断层,希望楼主能在github项目里用一个类似markDown的方式简单阐述一下流程就好~,感谢
已更新开发文档,欢迎交流