Sze-qq
Sze-qq
I'd love to add an open source large-scale deep learning system with high efficiency and low cost. It's quite easy to use and very efficient in AI model training. Contributors...
## Description I'd love to share a tutorial, from which we can learn how to train our AI model in a distributed manner step by step. ## Motivation and Context...
## 职位描述 1、负责公司内部多进程Python或Ray分布式引擎的设计和落地; 2、负责基于Ray计算引擎上的任务流设计和开发; 3、参与机器学习分布式计算相关业务的实现和优化,为机器学习任务开发高性能中间件和工具链。 ## 职位要求 1、计算机及相关专业毕业,本科以上学历; 2、熟练掌握Python,具备良好的开发习惯; ## 加分项 - 熟练C++,有并行计算相关经验者优先。 - 熟悉Ray计算框架者优先,有开源数据流引擎(如Spark Streaming, Flink) 经验者优先。 - 熟悉业界主流分布式计算引擎,包括但不限于(Flink,Spark Streaming,Presto,Druid)等;有机器学习,数据科学计算,kubernetes,高性能计算等相关工作经验优先。 ## (可选)岗位亮点 [潞晨科技](https://www.luchentech.com/)是一家分布式高性能计算领域的创业公司,旨在打造一个高效率低能耗的分布式人工智能系统,帮助企业最大化人工智能部署效率的同时最小化人工智能的部署成本,目前公司已获得包括创新工场、真格基金等多家机构天使轮投资。公司目前已在GitHub上开源大规模训练系统[Colossal-AI](https://github.com/hpcaitech/ColossalAI),目标成为业界最有影响力的AI系统软件的开源社区。 潞晨科技的团队分布在新加坡和北京,团队成员来自于斯坦福、清华、北大、浙大、新加坡国立等顶级名校。核心团队具备丰富互联网大厂从业经验,多位员工曾在PPoPP,SC,IPDPS,NuerIPS,ICLR等会议上发表第一作者论文,可以为员工提供充分的**工程**和**科研**指导。公司具备**充足的GPU资源**,为每一位员工的创新想法提供算力支持。潞晨科技致力于打造开放共享的开源社区,让你的每一行代码都可以让全世界看到。 潞晨科技创始人[尤洋博士](https://www.comp.nus.edu.sg/~youy/)毕业于UC Berkerly,目前是新加坡国立大学计算机系校长青年教授,LAMB优化器提出者,曾创造ImageNet以及BERT训练速度的世界纪录,他获得过IPDPS,ICPP的最佳论文,福布斯30岁以下精英。 潞晨科技工作以结果为驱动,采用硅谷办公方式,强调工作生活平衡,支持灵活的办公时间。公司提供水果、零食、餐补等多项福利。 ## 联系方式...
## 职位描述 1、深入研究超大规模神经网络在海量数据上的训练精度问题,实现超大规模神经网络的高精度训练; 2、利用预训练大模型,突破各类任务的精度瓶颈(包括NLP及计算机视觉等,NLP优先); 3、负责超大规模神经网络训练技术在公司实际业务场景中的落地使用; 4、负责研发通用模型,探索使用高精度Teacher进行知识蒸馏。 ## 职位要求 1、有比较扎实的计算机理论基础,熟练使用Python/C++编程; 2、有深度学习等算法基础,熟悉深度学习中的常见问题与算法,了解模型训练的原理,熟悉任一深度学习框架; ## 加分项 - 熟悉模型训练原理和Optimizer基本原理,了解分布式训练基本方法,对混合精度训练、数据并行等训练加速方法有所了解优先; - 有开源项目经验或者有较强的研究能力,于ICML、NIPS、AAAI、CVPR等CCF-B以上AI会议或期刊上发表过文章优先。 ## (可选)岗位亮点 [潞晨科技](https://www.luchentech.com/)是一家分布式高性能计算领域的创业公司,旨在打造一个高效率低能耗的分布式人工智能系统,帮助企业最大化人工智能部署效率的同时最小化人工智能的部署成本,目前公司已获得包括创新工场、真格基金等多家机构天使轮投资。公司目前已在GitHub上开源大规模训练系统[Colossal-AI](https://github.com/hpcaitech/ColossalAI),目标成为业界最有影响力的AI系统软件的开源社区。 潞晨科技的团队分布在新加坡和北京,团队成员来自于斯坦福、清华、北大、浙大、新加坡国立等顶级名校。核心团队具备丰富互联网大厂从业经验,多位员工曾在PPoPP,SC,IPDPS,NuerIPS,ICLR等会议上发表第一作者论文,可以为员工提供充分的**工程**和**科研**指导。公司具备**充足的GPU资源**,为每一位员工的创新想法提供算力支持。潞晨科技致力于打造开放共享的开源社区,让你的每一行代码都可以让全世界看到。 潞晨科技创始人[尤洋博士](https://www.comp.nus.edu.sg/~youy/)毕业于UC Berkerly,目前是新加坡国立大学计算机系校长青年教授,LAMB优化器提出者,曾创造ImageNet以及BERT训练速度的世界纪录,他获得过IPDPS,ICPP的最佳论文,福布斯30岁以下精英。 潞晨科技工作以结果为驱动,采用硅谷办公方式,强调工作生活平衡,支持灵活的办公时间。公司提供水果、零食、餐补等多项福利。 ## 联系方式 工作地点:北京、新加坡 简历投递邮箱:[[email protected]]()
## 职位描述 1、开发分布式人工智能系统并部署到大规模集群或云端; 2、从具体的场景和问题出发,研发和优化算法系统,产出解决方案应用到场景中; 3、参与人工智能技术与现有工具的融合设计和优化,提高产品性能; 4、撰写高质量的科技论文,有机会担任重要论文的第一作者。 ## 职位要求 1、精通 TensorFlow/PyTorch, Ray/DeepSpeed/NVIDIA Megatron ,熟悉上述系统的内部运行机制; 2、熟悉各类优化算法与模型架构, 熟悉 Python 或 C++ 的优化算法库, 包括各类基于梯度的经典算法与经典模型 (BERT, GPT-3, Swin Transformer, ViT, MLP-Mixer); 3、熟悉 SaaS、架构、编译器、网络、 CUDA 等方面知识或有相关项目经历;...
## 职位描述 1. 参与大模型分布式训练系统[Colossal-AI](https://github.com/hpcaitech/ColossalAI)的核心模块开发。 2. 在深度学习训练场景下,探索前沿的分布式系统设计,包括不限于通信优化、内存优化、计算优化、AI Compiler等。 3. 撰写技术报告和高水平学术论文,有机会担任重要论文的第一作者。 4. 工作地点北京中关村/新加坡,每周参与工作时间不少于4天,自驱力强的员工支持远程办公。 ## 职位要求 1. 熟悉深度学习框架(PyTorch/TensorFlow/JAX/MXNet)的底层工作原理。 2. 有良好的工程素养,热爱开源社区和分享精神,在github上有出色个人项目作品。 3. 有国内外顶尖实验室(研究领域分布式系统/体系结构/并行计算)研究经历,科研素养良好,撰写过高质量论文。 4. 获得过ACM编程竞赛、大学生超算竞赛奖项。 5. 以上满足一条即可。 ## (可选)岗位亮点 [潞晨科技]( https://www.luchentech.com/)是一家分布式高性能计算领域的创业公司,旨在打造一个高效率低能耗的分布式人工智能系统,帮助企业最大化人工智能部署效率的同时最小化人工智能的部署成本,目前公司已获得包括创新工场、真格基金等多家机构天使轮投资。公司目前已在GitHub上开源大规模训练系统Colossal-AI,目标成为业界最有影响力的AI系统软件的开源社区。 潞晨科技的团队分布在新加坡和北京,团队成员来自于斯坦福、清华、北大、浙大、新加坡国立等顶级名校。核心团队具备丰富互联网大厂从业经验,多位员工曾在PPoPP,SC,IPDPS,NuerIPS,ICLR等会议上发表第一作者论文,可以为实习生提供充分的**工程**和**科研**指导。公司具备**充足的GPU资源**,为每一位实习生的创新想法提供算力支持。潞晨科技致力于打造开放共享的开源社区,让你的每一行代码都可以让全世界看到。 潞晨科技创始人[尤洋博士](https://www.comp.nus.edu.sg/~youy/)毕业于UC Berkerly,目前是新加坡国立大学计算机系校长青年教授,LAMB优化器提出者,曾创造ImageNet以及BERT训练速度的世界纪录,他获得过IPDPS,ICPP的最佳论文,福布斯30岁以下精英。...