Smile_L
Smile_L
tf1 版本转tf2问题,当不添加textcnn网络时,训练预测均没有问题。但是当加入textcnn时训练时loss与acc都不错,但是预测都是错误的。以下tf2实现的textcnn基本都是直接转的。此外我还尝试tf.keras.layers.Conv2D()以及conv1d实现。但是效果都不行,本来考虑是不是训练周期等参数问题,但是跟您的项目参数保持一致,训练出来的模型就是有问题(有进行dropout),所以想请教一下您。 ```Python def textcnn(x): pooled_outputs = [] filter_sizes = [2, 3, 4, 5, 6, 7] inputs_expand = tf.expand_dims(x, -1) for filter_size in filter_sizes: filter_shape = [filter_size, 312, 1, 128]...
我跑完Bert+CRF 之后,发现评价指标只有0.4~0.5左右。请问是需要进行调参么,还是本来你在跑的时候也是一样的?
复现问题
您好,感谢您关于预训练的解答。但在我复现您的成果时碰到两类疑问: 1、msra数据集的复现效果好像不佳,不知道是不是我batch_size设置不够大的原因;另外想问一下msra的测试验证数据集划分为什么是2:1?最后还想问您一下git上提供的数据是完整的么? 2、我尝试让每次的结果都固定,但是即使是您提供的源代码,每次跑的结果仍然是不同的。不知道要怎么解决。期待您的回复。
预训练模型
您好,我从论文中发现,您有自己在新的预料中再进行预训练,我也想在自己的数据中进行预训练,想问一下您可以提供您的预训练代码吗?
想请教一个问题:之前用小数据量跑代码评价指标虽然差但应该是正常的,之后我用大数据量去跑,结果出现评价指标为零的情况,跑几个周期一直是。不知各位博主有没有遇到这种情况?希望能给些解决建议。
您好,感谢您的分享。想请教一下,在NER任务中,比如有['O','B-person','I-person','[PAD]','[CLS]','[SEP]']这几个标签,num_class应该设置多少?还有就是NER中preds和labels的输入是?可以举个例子么?
huggingface 中llama模型的转换。
### Description Thank you very much for open-sourcing such a great project. I installed without docker. Deploy according to the following steps: ```python # optional (setup env) conda create -n...
### Description Thanks for your help. I have opened the web interface normally. But there is a problem. When I talk to LLM, it is normal. But when I upload...
推理疑问
感谢您开源的优秀工作,我按照流程安装环境。但是有运行的时候如下问题: 1. 直接运行python gradio_app.py 。会自动下载模型,可以推理。但是视频好像都是2s的,如何可以设置生成的视频长度呢? 2. 直接运行sh scripts/run.sh 1024 会报错, ```python scripts/run.sh: 11: [: 1024: unexpected operator scripts/run.sh: 14: [: 1024: unexpected operator scripts/run.sh: 17: [: 1024: unexpected operator Invalid...