CoSENT_Pytorch
CoSENT_Pytorch copied to clipboard
CoSENT、STS、SentenceBERT
数据处理
 你好,你这里是把句子通过extend放在一个list里面,然后label也扩大了两份,请问你这对应后面的模型训练不会有问题吗?我的感觉就是你把句子对拆开了,然后答案复制两份,相当于对每个句子对中的句子分类0,1两个类别?
运行run_sentence_bert_transformers_reg_loss.py时,FileNotFoundError: [Errno 2] No such file or directory: './data/train_features.pkl.gz'。请问data文件夹下边train_features.pkl.gz在哪里下载?
您好,请问我clone后输入sh start.sh没有反应是对的吗?
https://github.com/shawroad/CoSENT_Pytorch/blob/81f90130338afc6671d54d2fe54ebe574b66e8a6/run_cosent.py#L32 您好,看到您在注释中提到,“这样写不太合适”,想请问是指哪里不合适呢?是否有更好的修改方法?
你好: 我已經訓練好模型在outputs資料夾了 那我該如何使用已經訓練好模型測試,不執行到訓練的部分?
想问下,训练数据没有shuffle是刻意为之吗,我训练下来shuffle后效果反而下降了
交互式模型测试
请问有交互式模型测试吗的脚本吗?
怎么测试?
请教一下,训练好之后,想要对两句话进行测试,tokenizer要用什么呢?看了下sentencebert没有保存训练后的tokenizer
获取bert输出的最后一个hiddenstate的每一个token的词向量相加取平均作为句向量,是不是应该先将padding部分的词向量置为0,然后再相加取平均呢?