Tianyu Zheng

Results 12 issues of Tianyu Zheng

File "c:\Users\MI\Desktop\gengxin\qtAutoUpdateApp\自动更新模块\自动更新 功能.py", line 205, in ui_结束 self.回调函数(self.数据) AttributeError: '检查更新线程' object has no attribute '数据'

若直接用官方代码开始训练,报错: [2024-09-15 18:57:46,727] [ INFO] - Starting training from resume_from_checkpoint : None LAUNCH INFO 2024-09-15 18:57:48,785 Exit code -7 从huggingface.co上把vae模型权重下载下来,报错: ![1726426998090](https://github.com/user-attachments/assets/cf912478-9844-42f4-951d-3f9a6e0e5253)

### PR Category User Experience ### PR Types Improvements ### Description 【Hackathon 7th No.19】NO.19为 Paddle 新增 load_state_dict_from_url API v1

PaddlePaddle Hackathon
contributor
API

### PR Category Auto Parallel ### PR Types Others ### Description 优化了一些PipelineStage框架中的代码,同时提交关于PipelineStage框架的单测,对比了朴素流水并行,以及单卡视角下的训练结果loss,来验证PipelineStage框架的可行性和准确性,v-schedules需要更多的开发代码,因此此处仅对其相关的函数进行简单测试。

contributor

### PR Category Auto Parallel ### PR Types Bug fixes ### Description ProcessMesh 的 get_group 方法,在实际使用时会重复创建通信组,导致显存爆炸,或者通信过程中会存在非预期的错误。因此在通过 ProcessMesh 转换为动手使用的通信组是得慎重,若此时已经存在与mesh.get_group方法相同mesh的group,使用get_group 应该获取该group,而不是直接创建新的通信组。

contributor

### PR Category Auto Parallel ### PR Types New features ### Description 为了让用户在使用pp策略时,正确切分模型到对应的mesh上,开发此工具。将根据 hidden_layer_num,mesh,pp_schedule,vpp_degree,来处理模型切分,并根据 layer_index,返回对应的mesh信息,也可一次返回全部layer的mesh信息。 - 如下是使用不同pp策略时,hidden_layer的分布状态: ![image](https://github.com/user-attachments/assets/3b42f8cb-2758-4c5e-b70a-690555306a6f)

contributor

### PR Category Auto Parallel ### PR Types Others ### Description 为Schedules新增单测,同时测试dp_pp混合情况,并且针对Schedules代码块存在的bug进行修复

contributor

公共知识(提升通用问答能力)+私有知识(垂域效果提升)一起训练。 想问问您这两种知识您训练的时候使用的是什么样的比例,问什么我用您finetun文件夹中的两个1000行数据一起训练时,loss一直没办法降下来

question

### PR Category User Experience ### PR Types Others ### Description 优化丰富FC的报错、警告信息

contributor

#### Before submitting - [ ] Lint code. If there are lint issues, please format the code first. ```shell # Install and register `pre-commit` in the project folder pip install...

contributor
stale