Smile_L issues

Results 12 issues of


                                            Smile_L

tf2使用textcnn网络问题

tf1 版本转tf2问题，当不添加textcnn网络时，训练预测均没有问题。但是当加入textcnn时训练时loss与acc都不错，但是预测都是错误的。以下tf2实现的textcnn基本都是直接转的。此外我还尝试tf.keras.layers.Conv2D()以及conv1d实现。但是效果都不行，本来考虑是不是训练周期等参数问题，但是跟您的项目参数保持一致，训练出来的模型就是有问题（有进行dropout)，所以想请教一下您。 ```Python def textcnn(x): pooled_outputs = [] filter_sizes = [2, 3, 4, 5, 6, 7] inputs_expand = tf.expand_dims(x, -1) for filter_size in filter_sizes: filter_shape = [filter_size, 312, 1, 128]...

评价指标

我跑完Bert+CRF 之后，发现评价指标只有0.4~0.5左右。请问是需要进行调参么，还是本来你在跑的时候也是一样的？

复现问题

您好，感谢您关于预训练的解答。但在我复现您的成果时碰到两类疑问： 1、msra数据集的复现效果好像不佳，不知道是不是我batch_size设置不够大的原因；另外想问一下msra的测试验证数据集划分为什么是2：1？最后还想问您一下git上提供的数据是完整的么？ 2、我尝试让每次的结果都固定，但是即使是您提供的源代码，每次跑的结果仍然是不同的。不知道要怎么解决。期待您的回复。

预训练模型

您好，我从论文中发现，您有自己在新的预料中再进行预训练，我也想在自己的数据中进行预训练，想问一下您可以提供您的预训练代码吗？

评价指标为零

想请教一个问题：之前用小数据量跑代码评价指标虽然差但应该是正常的，之后我用大数据量去跑，结果出现评价指标为零的情况，跑几个周期一直是。不知各位博主有没有遇到这种情况？希望能给些解决建议。

NER中num_class怎么设置？

您好，感谢您的分享。想请教一下，在NER任务中，比如有['O','B-person','I-person','[PAD]','[CLS]','[SEP]']这几个标签，num_class应该设置多少？还有就是NER中preds和labels的输入是？可以举个例子么？

请问有转换从huggingface下载llama模型的脚本吗？

huggingface 中llama模型的转换。

[BUG] - <title> without docker error

### Description Thank you very much for open-sourcing such a great project. I installed without docker. Deploy according to the following steps: ```python # optional (setup env) conda create -n...

bug

[BUG] - <title> Chat with files error.

### Description Thanks for your help. I have opened the web interface normally. But there is a problem. When I talk to LLM, it is normal. But when I upload...

bug

推理疑问

感谢您开源的优秀工作，我按照流程安装环境。但是有运行的时候如下问题: 1. 直接运行python gradio_app.py 。会自动下载模型，可以推理。但是视频好像都是2s的，如何可以设置生成的视频长度呢？ 2. 直接运行sh scripts/run.sh 1024 会报错， ```python scripts/run.sh: 11: [: 1024: unexpected operator scripts/run.sh: 14: [: 1024: unexpected operator scripts/run.sh: 17: [: 1024: unexpected operator Invalid...