jiamingkong

Results 11 comments of jiamingkong

> @jiamingkong 感谢贡献!麻烦签署下[CLA](https://github.com/PaddlePaddle/PaddleNLP/pull/2560#issuecomment-1158700652). `README.md`可以统一到`examples`下面,同时去掉`model_checkpoints`目录,转好的模型权重留言个链接即可,`cross_lingual_sentence_retrieval`是否可以移动到`text_matching`下面。 @gongel 您好,按照上述反馈,我们完成了如下修改: 1. 签署CLA 2. README移动到了`examples/text_matching/cross_lingual_sentence_retrieval`下面 3. 转换好的权重下载地址在上述README.md也保存了一份: 权重下载地址为: 链接:https://pan.baidu.com/s/1_lkvBOBOtdTGvoesWOicQg?pwd=ixlm 提取码:ixlm @guoshengCS 您好,cross_lingual_sentence_retrieval任务中使用的数据集在当前的datasets并没有开源实现,所以我们从facebook LASER的git里面把原始文本给保存了下来;在最新的提交中,我们已经去除了这个数据集合以减少git大小,同时附带了网盘下载地址,该地址在上述的README.md 中也有提到: Taboeta下载地址: 链接:https://pan.baidu.com/s/1bLd_GgoBRf6z4olC9dsVyg?pwd=clsr 提取码:clsr

@gongel 您好,按照您的review,我已经修改了代码,具体修改地方为: - 删除了不需要的debug语句 - Tokenizer中关于Fnet的字样删除了,像Fnet一样继承了AlbertTokenizer - 增加了use_cache, cache的传参位置,但是具体的实现上还没有改变,我还需要调试一下理解cache的具体工作原理,您指出的CodeGen模型是encoder decoder模型,而InfoXLM是全encoder模型,中间略有区别。 - 文档的更新,改变了权重下载位置的措辞

@gongel 您好,按照comment 2560 我删除了log 和 result csv范例,并且恢复了gitignore,同时将CausalLM删除,我当时尝试把mT6权重也一并转成paddle的过程给忘记了这件事(两个模型的训练方法几乎是一致的)。关于Taboeta的数据集,我目前在子目录README文件中给出了网盘的下载地址,我会单独给出Datasets的实现

@gongel 您好,请问还有什么地方需要我修改的吗?

您好,那按照当前git的状态,您之前提出的修改意见我这边都已经完成,剩余的是Datasets的实现,这个我单独提交PR

datasets 里面对应的数据原始zip 文件在这里: 链接:https://pan.baidu.com/s/1ilgJBhI7dej47LLrWWiHhQ?pwd=iXLM 提取码:iXLM

Hi, thank you for your work. I am very impressed by your fork as well. Could you elaborate a little bit how the alignment curve would look on the Mandarin...

![step-10000-align](https://user-images.githubusercontent.com/2761215/44627634-b480da80-a963-11e8-938a-e812e3613c56.png) Oh wow, it did show up!

Same issue here, I can't update the firmware, and the viewer can't recognize my device either

【报名】:40 SDGD优化器