训练了自定义模型后,给出的各个类型的概率,但是具体对应的是哪个类型呢?怎么看?
res.get_probability array([[1.41203867e-10, 2.22271422e-15, 9.99999998e-01, 2.50630140e-10, 2.95633885e-18, 1.27142354e-09]])
例如这样的,结果,我怎么看每个可能性对应的是哪个类型?是按照什么顺序排列的?
文档有提到,probability 包含对应类别索引下的概率(索引与每一条训练数据最后的类别一致)
例如你的数据集如下:
这是一条正常数据,0 这是赌博相关数据,1
输出内容中 res.get_probability array([[0.6, 0.4]])
0.6 的索引为 0,对应数据集中类别为 0 的类别。则正常数据
如果你使用的是预训练模型的话,稍后我会更新文档注明索引值对应的分类
也就是说现在是根据后面标签的值的顺序的来排列的了,似乎感觉不如以前percentage那个方法给出的结果直观,如果后面标签我用的不是数字而是字符,那就是根据字符排序了?
是的,为了兼容 csv,cherry 会提取每一行数据最后的类别作为标签进行训练。 无论是数字还是字符。我感觉这样的话能够根据方便开发者控制输出。当然如果你有好的建议也可以提出。
如果可以话,输出probability的时候,用dict输出,带上概率对应的标签最好了
好的,我会考虑的