zlh1992 comments

Results 12 comments of


                                            zlh1992

label的one-hot编码

老师目前对于第一课代码有个疑问。 #将label变成one-hot编码，因为softmax_propabilities是一个数组，是10个概率，每个概率代表着预测结果属于其index类的概率，为了计算交叉熵，我们需要把label也转换成一个数组 self.label_tensor=tf.one_hot(self.label_tensor,10) #计算交叉熵 cross_entropy=tf.nn.softmax_cross_entropy_with_logits(logits=self.fc_result,labels=self.label_tensor) 您修改成这个样子了目前跑不通报错： ValueError: Cannot feed value of shape (1000,) for Tensor 'one_hot:0', which has shape '(1000, 10)' 去掉onehot 仍然修改为cross_entropy=tf.nn.sparse_softmax_cross_entropy_with_logits(logits=self.fc_result,labels=self.label_tensor) 可以跑通,但是模型不收敛。acc一直很低。

zlh1992

label的one-hot编码

请问ACL2022-DuLeMon预计什么时候开源demo?

No result difference after QLoRa

RuntimeError: mat1 and mat2 shapes cannot be multiplied

qlora bfloat16 使用这个优化器出现bug

qwen base模型结果无法对齐

IndexError: pop from an empty deque in run_r1_grpo.py

[BUG] < mysql-container-local> mysql-container-loca容器闪退，

[BUG] <title> _mysql_connector.MySQLInterfaceError: Unknown MySQL server host 'mysql-container-local' (-2)

[Model] Deepseek GGUF support