Zhou Han
Zhou Han
https://alt.qcri.org/semeval2014/task4/ 提供的数据Restaurant数据是四分类 为啥这里使用的3分类呢?少了一个conflict类
请问网盘中训练好的mobilenet大概训练了几轮,loss是多少呢?
adjacency matrix是没有tokenize之前获得的,但由于bert使用的分词算法文本tokenize之后token可能和之前原本text位置对应不上,adjacency matrix不需额外处理一下吗,我在代码中好像没有看到相关操作,希望解答!谢谢!
想学习一下权重转换
[Bug]: Xorbits Inference RESTfulChatModelHandle.chat() got an unexpected keyword argument 'prompt'
### Bug Description ```python from llama_index.llms.xinference import Xinference llm = Xinference( endpoint=f"http://x.x.x.x:x", model_uid="deepseek-r1-distill-qwen", temperature=0.6, max_tokens=1024 ) response = llm.complete("Paul Graham is ") print(response) ``` Error message: ``` response_text = self._generator.chat(...