jiangzishan comments

Results 6 comments of


                                            jiangzishan

【Issue Help】 chatglm2-6b has some cases dismatch with golden

to be comfirmed.

【Issue Help】 chatglm2-6b has some cases dismatch with golden

previous golden values didn't contain eos_token_id, and might stop generating if generated tokens num exceeds 512. current golden values will contain eos_token_id, and will still stop generating if generated tokens...

关于Llama model split的疑问

可以参考这里的文档说明：https://github.com/bytedance/ByteMLPerf/tree/main/byte_infer_perf/llm_perf#split-model

关于Llama model split的疑问

都可以的，只不过目前测试相对简单，离线切的话，一方节省了线上broadcast和scatter的耗时，加载更快；另一方面，专注模型实现实现就行，不用管容易出错的ckpt加载和切分逻辑。

【llm_perf issue】using byte_infer_perf/llm_perf/launch.py to test chatglm, but meet multi-process competing

> @suisiyuan 你好，有空的时候可以帮忙看一看不？好的，我这边看看，应该是进程管理的问题。

llm_perf: generate config中 eos_token_id 配置问题

这里应该只是获取分词器的token_id配置吧，用于判断生成的token是否是eos从而决定是否停止生成。