大模型工程师
职位描述
岗位职责:
1.负责预训练大模型的工程化落地,探索业界先进的大模型框架;
2.围绕AI大模型领域,构建从数据采集、加工标注、算法训练部署、推理的数据算法流闭环;
3.负责大模型的结构设计、训练、微调、部署和优化,提高模型的效率、稳定性和可扩展性,推动大模型在边端侧的应用;
4.跟踪国内外前沿的大模型技术动态,持续改进和优化现有模型。
岗位需求:
1.本科及以上学历,计算机相关背景,3-5年工作经验;
2.精通Python、C/C++、Go等编程语言,熟练掌握PyTorch或TensorFlow等主流深度学习框架;
3.熟悉大模型分布式训练技术和框架库,如Megatron、DeepSpeed、Deepspeed-Chat等,熟悉框架库源码,有千卡以上集群的大模型训练经验;
4.精通大模型推理优化技术、模型压缩技术,如量化、剪枝和蒸馏等,精通各种微调技术,如LoRA、p-tuning、SFT、RLHF等;
5.有GPT类大模型优化及工程应用实践经验优先。
联系信息
简历投递到:zhangwenjun@algopower.cn
2024-04-12 15:35
넶0