SimCLUE
SimCLUE copied to clipboard
3000000+语义理解与匹配数据集。可用于无监督对比学习、半监督学习等构建中文领域效果最好的预训练模型
Results
3
SimCLUE issues
Sort by
recently updated
recently updated
newest added
预训练模型
2
提供的预训练模型[sentencebert_simclue](https://storage.googleapis.com/cluebenchmark/pretrained_models/sentencebert_simclue.zip)中是否少了一些文件?原版的[distiluse-base-multilingual-cased-v1](https://huggingface.co/sentence-transformers/distiluse-base-multilingual-cased-v1/tree/main)中包含了1_Pooling和2_Dense等一些东西。 如果没缺少该如何加载此模型并生成向量?
我看是整合了几个数据集,请问下data pair的句子对是否做过额外的清洗呢?有的数据集是翻译得到的,有的是标注得到的,那label的判断标准是否不够一致呢?