Ume-technology
Ume-technology
如题。 我看到博主用的 LSTM 做分类。 但是我想改成 CNN。调试了一下午,代码中 Bert_feature 中包含了一个 LSTM 结构,是我理解预训练模型有问题?不清楚为什么会这样。这套代码整体看起来总觉得怪怪的。
我使用了您开源出来的前端项目,另外我没有使用 npm 部署前端服务, 而是直接使用了您给出的命令行: --cors "*" 加载了这个前端文件。但是我有一个问题: 1. rasa 的 core 服务是如何和这个前端服务打通的,也就是说,打开前端后,我每次从前端输入的一句话是如何进入到 rasa 内部中,并且 rasa 可以维持住这个对话的状态的。 2. 这个问题基础上面的第一点,因为我现在有一个训练好的 rasa 服务,但是我需要把这个服务添加(或者说引入)到一个目前现有的聊天对话页面中,我应该如何做呢? 还请您不吝赐教。期待得到您的回复,我的 VX:18336304089 如果您愿意提供帮助,我愿意有偿获得您的指导与帮助。
GPU 显存问题
我想走一下 Bert + CNN 的SST-2 数据的分类效果。 但是上来就报出 GPU 溢出,我换了公司服务器还是溢出,公司显存 10.75 G 我想知道这是为什么,是确实溢出还是说代码哪里我需要调整呢?
各位开发人员好: 最近我回头看反向传播的过程. 在全连接神经网络的反向传播的实现代码部分 (class NetWork): ` def calc_gradient(self, label): delta = self.layers[-1].activator.backward(self.layers[-1].output) * (label - self.layers[-1].output) for layer in self.layers[::-1]: layer.backward(delta) delta = layer.delta return delta`. 结合文章, 我没有看明白求解梯度的这个第一行代码是在计算什么. 按照反向传播的起点来算, 应该是从损失函数开始算起,...
如题. 另外就是我想知道 preprocess_task.py 生成的 sequence 的数据 extra 信息是不是在数据增强阶段进行了 1 epoch 的训练时使用的. 因为我想知道这些被提取出来的 token 的 extra features 是如何被使用的. 如果是, 那就是题目给出的问题. 数据增强的过程是在哪个脚本实现的呢?
老师您好,我尝试运行该repo时,碰到Polygon怎么都安装不上去的情况。我查资料试了Polygon2 Polygon3 polygon 等等版本,Windows ,Linux ,mac 都测试了。 但是运行test.py时依然爆出没有Polygon的错误。 我也尝试想从源码安装,但是我没找到Polygon的项目源码。请问老师你的Polygon版本是多少,以及是如何安装的呢? 我不确定问题到底出在了哪里,因为我从readme中提到的 python3.6 to python3.9 都测试。 很无奈没成功,因此特来请教,希望得到老师的帮助。 再次谢过老师!