职位描述
岗位职责:
1.从事大模型的训练和优化,包括语言大模型、图文多模态大模型、语音大模型、图像生成大模型, 点云多图大模型,进行模型架构设计和技术攻坚;
2.将大模型用于内容理解、内容生成,达到工业级的稳定性和规模应用,应用到我司特殊产品等业务,
任职要求:
1. 计算机、数学或统计学相关专业硕士及以上学历,具有2-3年以上计算机大模型/NLP/预训练模型相关工作经验;
2. 熟练使用pytorch/tensorflow等至少一种主流深度学习框架,能够独立实现前沿模型;
3、熟练掌握业界主流大语言模型(GPT、ChatGLM、LLaMA等)的算法原理,掌握SFT、RLHF等训练方式和智能对话等应用范式优先;
4、有大模型训练优化/大模型落地经验/国际顶会论文发表经验优先。
职位类别:计算机软、硬件/互联网/IT
专业要求:不限