docs icon indicating copy to clipboard operation
docs copied to clipboard

分布式任务领取提交体验评估

Open enkilee opened this issue 3 years ago • 0 comments

项目环境

AI Studio

认领任务

Wide&Deep模型

1.导入分布式训练需要的依赖包

  • 完成情况(成功/不成功) :导入依赖包成功
  • 遇到问题:没有遇到问题
  • 解决方法(无法解决需注明):
  • 对应文档是否描述清晰(如不清晰,需注明问题并提供文档链接):清晰

2.定义分布式模式并初始化分布式训练环境

  • 完成情况(成功/不成功) :成功
  • 遇到问题:无
  • 解决方法(无法解决需注明):
  • 对应文档是否描述清晰(如不清晰,需注明问题并提供文档链接): 描述清晰。

3.加载模型

  • 完成情况(成功/不成功) :成功
  • 遇到问题:五
  • 解决方法(无法解决需注明):
  • 对应文档是否描述清晰(如不清晰,需注明问题并提供文档链接):

4.构建 dataset 加载数据

  • 完成情况(成功/不成功) :成功
  • 遇到问题:
  • 解决方法(无法解决需注明):
  • 对应文档是否描述清晰(如不清晰,需注明问题并提供文档链接): 清晰

5.定义参数更新策略及优化器

  • 完成情况(成功/不成功) :
  • 遇到问题:model没有loss参数
  • 解决方法(无法解决需注明):model.loss改成model.cost
  • 对应文档是否描述清晰(如不清晰,需注明问题并提供文档链接): 清晰

6.开始多机分布式训练

  • 完成情况(成功/不成功) :不成功
  • 遇到问题:fetch_list=[model.loss],同5。train_model.cost 要改成model.cost
  • 解决方法(无法解决需注明):model.loss改成model.cost. train_model.cost 要改成model.cost
  • 对应文档是否描述清晰(如不清晰,需注明问题并提供文档链接): 清晰

其他问题或建议

相关代码

https://aistudio.baidu.com/aistudio/projectdetail/4520356

项目环境

AI Studio

认领任务

DSSM模型

1.导入分布式训练需要的依赖包

  • 完成情况(成功/不成功) :导入依赖包成功
  • 遇到问题:没有遇到问题
  • 解决方法(无法解决需注明):
  • 对应文档是否描述清晰(如不清晰,需注明问题并提供文档链接):清晰

2.定义分布式模式并初始化分布式训练环境

  • 完成情况(成功/不成功) :成功
  • 遇到问题:无
  • 解决方法(无法解决需注明):
  • 对应文档是否描述清晰(如不清晰,需注明问题并提供文档链接): 描述清晰。

3.加载模型

  • 完成情况(成功/不成功) :成功
  • 遇到问题:五
  • 解决方法(无法解决需注明):
  • 对应文档是否描述清晰(如不清晰,需注明问题并提供文档链接):

4.构建 dataset 加载数据

  • 完成情况(成功/不成功) :成功
  • 遇到问题:
  • 解决方法(无法解决需注明):
  • 对应文档是否描述清晰(如不清晰,需注明问题并提供文档链接): 清晰

5.定义参数更新策略及优化器

  • 完成情况(成功/不成功) :成功
  • 遇到问题:
  • 解决方法(无法解决需注明):
  • 对应文档是否描述清晰(如不清晰,需注明问题并提供文档链接): 清晰

6.开始多机分布式训练

  • 完成情况(成功/不成功) :成功
  • 遇到问题:
  • 解决方法(无法解决需注明):
  • 对应文档是否描述清晰(如不清晰,需注明问题并提供文档链接): 清晰

其他问题或建议

相关代码

https://aistudio.baidu.com/aistudio/projectdetail/4522748

enkilee avatar Sep 09 '22 05:09 enkilee