ArnoTeng
Repositories
Issues
Comments
Results
2
issues of
ArnoTeng
博主这个模型结构内,In18 里有一个定义全局网络层的操作,是为了保证每一次解码的时候Attention参数都是共享的吗,我自己照着写了一个,当时看这一步觉得有点多余就没做定义,最后发现每一个时序的Attention参数是不共享的了。。。求指点哦~
请问是否可以将工具替换成自己的数据检索工具,仅借用你们基座的planing和reasoning能力做信息检索和回复生成呢?
2