【职位描述】
研发视觉(尤其是视频)、自然语言、图文多模态大模型,以原创算法探索认知边界,推动大模型的创新应用。
【职位要求】
1、预计毕业时间介于2024年9月至2025年8月之间,硕士及以上学历;
2、过硬的科研背景:对于博士一般应在ML、CV、NLP基础模型、内容生成领域发表顶会、顶刊论文3篇及以上(第一作者),或作为核心技术人员参与过领域内重量级大模型的研发项目,对于硕士条件可适当放宽;
3、扎实的工程基础,熟悉GPU集群分布式训练相关技术,具备一定的分布式开发,系统调优,状态监控,故障诊断等技能;
4、有10B参数以上NLP大模型、1B参数以上CV/多模态大模型、或是200GPU节点以上其他模型训练经验者优先;
5、有(自然语言或多模态)多轮对话系统、图文内容生成系统全流程开发(例如数据采标、数据清洗、模型设计、模型微调、偏好对齐、提示词工程、性能评测等)经验者优先;
6、有大规模视频理解模型预训练、高质量视频生成与编辑研究经历经验者优先。