愚人王

Results 4 comments of 愚人王

细节报错: > Traceback (most recent call last): File "/opt/conda/lib/python3.10/site-packages/modelscope/utils/ast_utils.py", line 466, in _get_single_file_scan_result output = self.astScaner.generate_ast(file) File "/opt/conda/lib/python3.10/site-packages/modelscope/utils/ast_utils.py", line 365, in generate_ast output = self.scan_import(node, show_offsets=False) File "/opt/conda/lib/python3.10/site-packages/modelscope/utils/ast_utils.py", line 164,...

我可能找到了原因,目前每次运行后,会生成一个新的ast_indexer,而这个ast_indexer会导致再次运行时的程序出现上述问题。当我使用了之前的ast_indexer后,可以正常运行,但程序会自动生成一个会报错的ast_indexer覆盖可以正常运行的ast_indexer

很抱歉,镜像我无法提供。但是我可以提供可以正常运行的ast_indexer和之后生成的错误ast_indexer。目前,我不再映射MODELSCOPE_CACHE到现有路径,而是使用k8s临时的默认MODELSCOPE_CACHE来避免之前的问题。我使用的多机多卡训练策略是否会对这个问题产生影响?

> > 我可能找到了原因,目前每次运行后,会生成一个新的ast_indexer,而这个ast_indexer会导致再次运行时的程序出现上述问题。当我使用了之前的ast_indexer后,可以正常运行,但程序会自动生成一个会报错的ast_indexer覆盖可以正常运行的ast_indexer > > 如果您是多机器多卡,可能会有多个worker同时些ast_indexer可能,您可以尝试让master先启动生成这个文件,其他worker使用同一个已经生成的。 这可能不是原因。在我使用单机单卡运行时,同样会出现这个问题