data-juicer icon indicating copy to clipboard operation
data-juicer copied to clipboard

FT-Data Ranker_大语言模型微调数据赛, 是否可以分享该比赛的数据用于对Data-Juicer项目的使用。

Open user2311717757 opened this issue 10 months ago • 1 comments

尊敬的Data-Juicer框架开发者,你们好。最近,我们有对大模型数据进行处理的需求。从论文“Data-Juicer: A One-Stop Data Processing System for Large Language Models”调研到Data-Juicer的开源大模型数据处理框架。我们想进一步使用和探索这个框架。正好,我们看到了你们在天池比赛中发布了“FT-Data Ranker_大语言模型微调数据赛(7B模型赛道)”比赛。但是比赛已经结束无法获取原始数据。是否可以提供原始数据以供我们探索和使用Data-Juicer框架。万分感谢🙏。

user2311717757 avatar Mar 03 '25 09:03 user2311717757

嗨 @user2311717757 ,感谢你对 Data-Juicer 的关注与使用!

比赛结束后,我们为系列赛开放了日常学习赛,那里可以获取到数据等相关资料并继续提交结果参与打榜,其中7B赛道的比赛地址为:https://tianchi.aliyun.com/competition/entrance/532291?spm=a2c22.12281976.0.0.15a638969XbMsh

欢迎进行尝试~

HYLcool avatar Mar 04 '25 06:03 HYLcool

Close this stale issue.

HYLcool avatar May 06 '25 02:05 HYLcool