sunshinesDL

Results 18 comments of sunshinesDL

> 我也在想怎么做。应该是要多实例部署,譬如一卡一个 是的,我现在也是这样实现的 🤣🤣,4个卡上分别加载模型,使用不同的数据同时进行推理。

我在直接推理时,逐个样本进行推理,发现向 readme中说的,在 from_pretrained 的调用中增加 了revision="v1.1.0" 参数,在多个样本上生成的回复就是相同的,测试了多次都相同(不过上千条样本,没有注意比对),大家在推理时有发现这样的情况吗?另外,有大神解释下 do_sample 这个参数具体的作用到底是啥吗? (因为自己没看源码🤣🤣)

> 请问兄弟现在找到构建的方法了吗?

> 求问chat方法,有办法实现批量推理吗? 同问,请问兄弟你现在找到答案了吗?

> ``` > git clone https://github.com/OpenLMLab/MOSS.git > cd MOSS > cp .models/custom_autotune.py ~/.cache/huggingface/modules/transformers_modules/local/ > ``` 非常感谢,解决问题了,不过是否应该把 cp 命令中的 .models 换为 models,它应该不是隐藏文件 😂

非常感谢您的回信!这让我对 面经系列 和 工具踩坑系列有了详细的了解,我会进一步考虑订阅!再次感谢您的分享!

@WrathGluttony 您好,结合楼下大佬的分享,您现在解决这一问题了吗 😂 我尝试了下 kimi、元宝、豆包等网站,发现其网址都是以 https://www.XXX.com/chat/ 开头的,借鉴 @eastarpen 大哥的示例,我写出了以下这类规则: `kimi|k: https://kimi.moonshot.cn/chat?q=%s \ blank=https://www.kimi.com Kimi` 但发现都不能像 chatgpt、pp 这样在页面跳转时就把搜索词传递给AI网站,而需要在文本框中二次输入搜索词,不满足需求。 请问您对此有相关的方法或想法吗 😁