其他企业 科学研究和技术服务业 50-200人 浙江省杭州市西湖区
面议 浙江省杭州市西湖区 全职 本科及以上 2人 2026-06-30
2026-03-02 09:11:42
岗位职责:
1、负责可控角色图像/视频生成(单人、多姿态、多角色同框),持续优化角色一致性(身份/五官/服饰等)、画质、速度及稳定性,对业务效果负责;
2、搭建并优化数据飞轮(数据挖掘/清洗、自动标注、标签体系、数据增强与去重),提升训练与评测效率;
3、跟踪 AIGC 前沿技术(如 SDXL/Flux/Qwen Image/Wan 等),完成可行性验证与工程落地;
4、协同产品/设计/工程团队,将需求转化为技术方案,撰写技术文档,确保方案可维护、可扩展;
5、建立并维护生成效果评测体系(如 FID/CLIPScore、身份一致性、延迟与吞吐监控),支撑高效迭代。
任职要求:
1、扎实的深度学习基础,熟悉扩散模型、对比学习、多模态表征等核心理论;
2、至少掌握一种主流生成模型(如 Stable Diffusion/SDXL、Flux),了解其原理与模块构成;
3、具备图像生成或视觉语言模型微调经验,能独立完成训练数据构建;
4、熟练使用 Python、PyTorch 及 Linux 环境,具备工程化实验流程的能力(脚本化、可复现、可观测);
5、对新技术有强烈好奇心与执行力,能在不确定环境中快速试错、复盘并推进落地。
加分项:
1、深度实践过角色一致性生成、多主体合成与布局控制等关键技术,并具备解决冲突的能力;
2、具备大规模多模态数据处理经验,熟悉数据质量管理与自动化评测体系构建(含身份一致性、图像质量等指标);
3、在生成领域有研究成果(论文/专利)、开源贡献或高质量个人项目(可提供 Demo/代码);
4、具备视觉审美与 Prompt Engineering 能力,能将技术指标有效转化为产品效果。
职位类别:计算机软、硬件/互联网/IT
专业要求:不限
我们是一家源自西湖大学深度学习实验室的创新企业,自2021年成立以来,便深耕人工智能多模态大模型技术,致力于将前沿科技转化为产业力量。
创始人蓝振忠,西湖大学特聘研究员、博士生导师。博士毕业于卡内基梅隆大学计算机系,长期致力于自然语言处理、计算机视觉和深度学习的融合与应用研究。曾任谷歌人工智能研究院科学家,多家公司首席科学家 ,是 NLP轻量级预训练语言模型“ALBERT”第一作者,亦是目前国内被最广泛应用的大模型评价指标“CLUE”和“SuperCLUE”的 联合推出人 。
核心自研技术
自主研发的端到端语音模型“心辰Lingo”,集成了语音识别、自然语言处理、意图识别、对话管理以及语音合成等多项前沿技术,实现了从语音输入到语音反馈的完整交互过程。
市场领先的AI产品
凭借在AI领域的深厚积累与持续创新精神,我们已成功推出多款备受欢迎的AI产品,如AI心理咨询平台“聊会小天”、AI智能写作平台“Friday”以及AI绘画平台“造梦日记”等。同时,在海外市场上,“AI Companion” 、“AI 可交互内容”系列也屡获佳绩,月访问量突破千万,居各大AI产品榜单前列。
丰富的B端项目经验
请稍候...