Yu Liu
Yu Liu
 Here's a mistake
Can you provide a model of three different pre-training methods for the second stage that you have already trained? The second stage of pre-training is too time-consuming, I want to...
求pytorch版本
非常好的项目
目前发现的第二个统一闭源模型为openAI接口的方法的repo, 我来测试一下。
Do you have a pytorch version? Urgent need!!!!
希望支持新模型
希望支持最近出的模型 deepseek-coder 7B/33B 和 SUS-Chat-34B https://github.com/deepseek-ai/deepseek-coder https://huggingface.co/SUSTech/SUS-Chat-34B
能否对 serving/model_handler 下模型的infer.py 继续解耦。 最终实现用户可以用 自己的 方式 实现 。 chat_stream chat embedding (类似于抽象方法) 等方法 就可以,就可以 run 此服务
作者是否尝试过 代码中的 trainer.train(resume_from_checkpoint=resume_from_checkpoint) 是否可以正常使用,  我使用的时候报错,huggingface 现在应该不支持resume lora 模型
代码写的很棒!简单易懂,比其他 高 star 的项目好多了
Benchmarking summary: Time taken for tests: 22.512 seconds Expected number of requests: 100 Number of concurrency: 128 Total requests: 100 Succeed requests: 100 Failed requests: 0 Average QPS: 4.442 Average...