JasonCZH

Results 6 issues of JasonCZH

Are there plans to develop on the pytorch framework? Many LLM develop based on torch, like LLama, Qwen, etc. Some developers may not be familiar with JAX.

### PR types Bug fixes ### PR changes model ### Description fix bug [unimo bug](https://github.com/PaddlePaddle/PaddleNLP/issues/8651)

contributor

### 软件环境 ```Markdown - paddlepaddle: 2.5.2 - paddlepaddle-gpu: 2.5.2 - paddlenlp: 2.8.0 ``` ### 重复问题 - [X] I have searched the existing issues ### 错误描述 ```Markdown UNIMO模型的resize_token_embeddings方法不会修改decoder的vocab_size,导致input_embeddings_size和output_embeddings_size没法对齐 ``` ### 稳定复现步骤...

bug
stale

1. `benchmark/infer_baichuan.py`里面有`os.environ["CUDA_VISIBLE_DEVICES"] = "7"`没删除,运行时没注意到,卡了我半小时。。。。 2. 代码里面很多里面都不能传参,都是写死的。比如infer文件不接受模型位置的参数、没有设置输入长度参数,`/agents/kagent.py`里面模型名字也是写死的。 3. `kwaiagents/agent_start.py`模型名字莫名其妙加入lower处理,导致测试其他模型的时候,传入的名字一直和fastchat模型名字对不上。。。。

Many important papers about data selection are not included, like LESS, MoDS, IFD, Superfiltering, LIFT, InsTag, DEITA. Maybe it is time to updated the list. :)

WebWalker有如下问题`尼高品牌网络在2024年下半年参与并完成的两个主要合作项目分别是哪两个公司?`,使用多种api,如Bright、bocha、Serper均返回如下网页:`https://www.niegoweb.com/news-692-692-1.html`,可见参考答案的`深圳市积加跨境网络科技有限公司和广州光达创新科技有限公司`显然不是满足问题的唯二答案,其他如`精诚达, 光峰科技`等3-4间公司也满足该问题条件。