dolphin

Results 18 comments of dolphin

> > Traceback (most recent call last): > > File "bert_service.py", line 39, in > > rst = bc.encode([str, str]) #测试同时输入两个句子,多个输入同理 > > File "/home/junruit/.local/lib/python3.6/site-packages/bert_base/client/**init**.py", line 197, in arg_wrapper >...

> I start the server by command as following: > > ``` > python3 run.py \ > -mode CLASS \ > -bert_model_dir ~/home/Deployed/bert/pre-trained/chinese_L-12_H-768_A-12 \ > -model_dir ~/home/Deployed/BERT-BiLSTM-CRF-NER/task_model/text_class \ > -model_pb_dir...

> 已修复,是因为nbest没有满足条件的答案。对应代码已加入start_index和end_index字段(默认为0)。 > https://github.com/ymcui/cmrc2018/blob/master/baseline/run_cmrc2018_drcd_baseline.py#L900 非常感谢您的回复,所以您修改过后的代码直接就能适用用SQuAD2.0数据集了吗?还是也需要再修改?

另外,对于中文文本和英文文本混合的情况,您是否有测试过模型的效果呢?我这边运行是ok的,但不确定该baseline是否适用于混合语言的情况,向您请教,感谢。

> 1. 只跑SQuAD 2.0的话,建议使用bert原版代码:https://github.com/google-research/bert/blob/master/run_squad.py > 2. 中文版BERT词表中包含一些常见英文单词,这里的代码是可以支持中英混合数据的。 根据您的第2点回答,若自行扩充vocab.txt,是否就可以更好的支持中英文混合数据。但因为数据的格式是同SQuAD2.0,所以要修改您的代码以适应;另外如果我想要使用例如BERT-wwm-ext作为预训练模型,该预训练模型是否可以很好的支持中英文混合数据,还是说建议只用在中文数据中?

nbest.append( _NbestPrediction( text=final_text, start_logit=pred.start_logit, end_logit=pred.end_logit, start_index=pred.start_index, end_index=pred.end_index)) # just create a nonce prediction in this case to avoid failure. if not nbest: nbest.append( _NbestPrediction(text="empty", start_logit=0.0, end_logit=0.0, start_index=0, end_index=0)) # if...

Traceback (most recent call last): File "/tf/NOC-QA/baseline/run_cmrc2018_drcd_baseline.py", line 1449, in flags.mark_flag_as_required("bert_config_file") File "/usr/local/lib/python3.5/dist-packages/tensorflow/python/platform/app.py", line 125, in run _sys.exit(main(argv)) File "/tf/NOC-QA/baseline/run_cmrc2018_drcd_baseline.py", line 1378, in main FLAGS.n_best_size, FLAGS.max_answer_length, File "/tf/NOC-QA/baseline/run_cmrc2018_drcd_baseline.py", line 963,...

谢谢您~我是在您代码的基础上修改的,所以我保留了您代码中的start_index和end_index,我试试看不使用这两个agrument是否可行?当初您是什么原因要加入这两个argument呢?是否有必要呢

> 可不用这两个index信息,当时是为了把index信息写入文件所以留下的这两个字段。 > 如果你不用的话可以把后续涉及到这两个index的代码都删掉。 谢谢,我删掉了,能够正常运行。 对了,请问MacBERT-large-extData-v2这个模型你们有开源了吗,目前再cmrc2018排在榜首(EM:80.409 | F1:93.768)。我在https://github.com/ymcui/MacBERT没有找到这个