岗位职责:
1、负责可控角色图像/视频生成(单人、多姿态、多角色同框),持续优化角色一致性(身份/五官/服饰等)、画质、速度及稳定性,对业务效果负责;
2、搭建并优化数据飞轮(数据挖掘/清洗、自动标注、标签体系、数据增强与去重),提升训练与评测效率;
3、跟踪 AIGC 前沿技术(如 SDXL/Flux/Qwen Image/Wan 等),完成可行性验证与工程落地;
4、协同产品/设计/工程团队,将需求转化为技术方案,撰写技术文档,确保方案可维护、可扩展;
5、建立并维护生成效果评测体系(如 FID/CLIPScore、身份一致性、延迟与吞吐监控),支撑高效迭代。
任职要求:
1、扎实的深度学习基础,熟悉扩散模型、对比学习、多模态表征等核心理论;
2、至少掌握一种主流生成模型(如 Stable Diffusion/SDXL、Flux),了解其原理与模块构成;
3、具备图像生成或视觉语言模型微调经验,能独立完成训练数据构建;
4、熟练使用 Python、PyTorch 及 Linux 环境,具备工程化实验流程的能力(脚本化、可复现、可观测);
5、对新技术有强烈好奇心与执行力,能在不确定环境中快速试错、复盘并推进落地。
加分项:
1、深度实践过角色一致性生成、多主体合成与布局控制等关键技术,并具备解决冲突的能力;
2、具备大规模多模态数据处理经验,熟悉数据质量管理与自动化评测体系构建(含身份一致性、图像质量等指标);
3、在生成领域有研究成果(论文/专利)、开源贡献或高质量个人项目(可提供 Demo/代码);
4、具备视觉审美与 Prompt Engineering 能力,能将技术指标有效转化为产品效果。
岗位职责:
1、负责可控角色图像/视频生成(单人、多姿态、多角色同框),持续优化角色一致性(身份/五官/服饰等)、画质、速度及稳定性,对业务效果负责;
2、搭建并优化数据飞轮(数据挖掘/清洗、自动标注、标签体系、数据增强与去重),提升训练与评测效率;
3、跟踪 AIGC 前沿技术(如 SDXL/Flux/Qwen Image/Wan 等),完成可行性验证与工程落地;
4、协同产品/设计/工程团队,将需求转化为技术方案,撰写技术文档,确保方案可维护、可扩展;
5、建立并维护生成效果评测体系(如 FID/CLIPScore、身份一致性、延迟与吞吐监控),支撑高效迭代。
任职要求:
1、扎实的深度学习基础,熟悉扩散模型、对比学习、多模态表征等核心理论;
2、至少掌握一种主流生成模型(如 Stable Diffusion/SDXL、Flux),了解其原理与模块构成;
3、具备图像生成或视觉语言模型微调经验,能独立完成训练数据构建;
4、熟练使用 Python、PyTorch 及 Linux 环境,具备工程化实验流程的能力(脚本化、可复现、可观测);
5、对新技术有强烈好奇心与执行力,能在不确定环境中快速试错、复盘并推进落地。
加分项:
1、深度实践过角色一致性生成、多主体合成与布局控制等关键技术,并具备解决冲突的能力;
2、具备大规模多模态数据处理经验,熟悉数据质量管理与自动化评测体系构建(含身份一致性、图像质量等指标);
3、在生成领域有研究成果(论文/专利)、开源贡献或高质量个人项目(可提供 Demo/代码);
4、具备视觉审美与 Prompt Engineering 能力,能将技术指标有效转化为产品效果。
岗位职责:
1、负责可控角色图像/视频生成(单人、多姿态、多角色同框),持续优化角色一致性(身份/五官/服饰等)、画质、速度及稳定性,对业务效果负责;
2、搭建并优化数据飞轮(数据挖掘/清洗、自动标注、标签体系、数据增强与去重),提升训练与评测效率;
3、跟踪 AIGC 前沿技术(如 SDXL/Flux/Qwen Image/Wan 等),完成可行性验证与工程落地;
4、协同产品/设计/工程团队,将需求转化为技术方案,撰写技术文档,确保方案可维护、可扩展;
5、建立并维护生成效果评测体系(如 FID/CLIPScore、身份一致性、延迟与吞吐监控),支撑高效迭代。
任职要求:
1、扎实的深度学习基础,熟悉扩散模型、对比学习、多模态表征等核心理论;
2、至少掌握一种主流生成模型(如 Stable Diffusion/SDXL、Flux),了解其原理与模块构成;
3、具备图像生成或视觉语言模型微调经验,能独立完成训练数据构建;
4、熟练使用 Python、PyTorch 及 Linux 环境,具备工程化实验流程的能力(脚本化、可复现、可观测);
5、对新技术有强烈好奇心与执行力,能在不确定环境中快速试错、复盘并推进落地。
加分项:
1、深度实践过角色一致性生成、多主体合成与布局控制等关键技术,并具备解决冲突的能力;
2、具备大规模多模态数据处理经验,熟悉数据质量管理与自动化评测体系构建(含身份一致性、图像质量等指标);
3、在生成领域有研究成果(论文/专利)、开源贡献或高质量个人项目(可提供 Demo/代码);
4、具备视觉审美与 Prompt Engineering 能力,能将技术指标有效转化为产品效果。
岗位职责:
1、独立负责语音核心能力(ASR、TTS、音频增强等)在真实业务中的算法迭代与落地,构建稳定、低延迟的语音交互链路;
2、承担从数据清洗、特征工程、模型训练到推理部署的全链路交付,并对算法在用户体验及业务指标上的最终影响负责;
3、持续关注语音与 LLM 结合的前沿技术趋势,快速实现可运行的技术原型(Demo),推动论文成果向产品能力的有效转化;
4、深度参与系统性能优化与工程稳定性攻坚,在工程侧解决高并发下的延迟峰值、资源占用及网络抖动等核心技术问题。
?
任职要求:
1、具备扎实的语音算法基础,深入理解 ASR/TTS 主流模型架构(如 Transducer, Diffusion, VITS 等)并有实际落地经验;
2、拥有卓越的工程能力,精通 Python 编程,熟悉模型服务化及流式推理(WebSocket/gRPC/Streaming)的相关技术实现;
3、具备敏锐的产品意识与 Owner 精神,能平衡算法理想指标与实际业务约束,以用户体验为导向进行技术选型与取舍;
4、具备强大的 Demo 驱动能力,能够独立完成从模型封装到“能跑、能体验”的最小可行性产品(MVP)搭建。
?
加分项:
1、有语音 + LLM(如 Audio-Native LLM)或多模态交互项目经验,能精准捕捉前沿技术与产品契合点;
2、熟悉 GPU 推理框架及加速工具(如 TensorRT-LLM, vLLM, ONNX 等),有模型量化或推理性能压榨经验;
3、具备大规模线上语音产品(日活及并发量较高场景)的系统架构设计或维护经验;
4、自身对 AI 社交或内容产品有深度理解,能从技术侧主动提出提升用户交互爽感的创新方案。
岗位职责:
1、负责可控角色图像/视频生成(单人、多姿态、多角色同框),持续优化角色一致性(身份/五官/服饰等)、画质、速度及稳定性,对业务效果负责;
2、搭建并优化数据飞轮(数据挖掘/清洗、自动标注、标签体系、数据增强与去重),提升训练与评测效率;
3、跟踪 AIGC 前沿技术(如 SDXL/Flux/Qwen Image/Wan 等),完成可行性验证与工程落地;
4、协同产品/设计/工程团队,将需求转化为技术方案,撰写技术文档,确保方案可维护、可扩展;
5、建立并维护生成效果评测体系(如 FID/CLIPScore、身份一致性、延迟与吞吐监控),支撑高效迭代。
任职要求:
1、扎实的深度学习基础,熟悉扩散模型、对比学习、多模态表征等核心理论;
2、至少掌握一种主流生成模型(如 Stable Diffusion/SDXL、Flux),了解其原理与模块构成;
3、具备图像生成或视觉语言模型微调经验,能独立完成训练数据构建;
4、熟练使用 Python、PyTorch 及 Linux 环境,具备工程化实验流程的能力(脚本化、可复现、可观测);
5、对新技术有强烈好奇心与执行力,能在不确定环境中快速试错、复盘并推进落地。
加分项:
1、深度实践过角色一致性生成、多主体合成与布局控制等关键技术,并具备解决冲突的能力;
2、具备大规模多模态数据处理经验,熟悉数据质量管理与自动化评测体系构建(含身份一致性、图像质量等指标);
3、在生成领域有研究成果(论文/专利)、开源贡献或高质量个人项目(可提供 Demo/代码);
4、具备视觉审美与 Prompt Engineering 能力,能将技术指标有效转化为产品效果。
岗位职责:
1、负责可控角色图像/视频生成(单人、多姿态、多角色同框),持续优化角色一致性(身份/五官/服饰等)、画质、速度及稳定性,对业务效果负责;
2、搭建并优化数据飞轮(数据挖掘/清洗、自动标注、标签体系、数据增强与去重),提升训练与评测效率;
3、跟踪 AIGC 前沿技术(如 SDXL/Flux/Qwen Image/Wan 等),完成可行性验证与工程落地;
4、协同产品/设计/工程团队,将需求转化为技术方案,撰写技术文档,确保方案可维护、可扩展;
5、建立并维护生成效果评测体系(如 FID/CLIPScore、身份一致性、延迟与吞吐监控),支撑高效迭代。
任职要求:
1、扎实的深度学习基础,熟悉扩散模型、对比学习、多模态表征等核心理论;
2、至少掌握一种主流生成模型(如 Stable Diffusion/SDXL、Flux),了解其原理与模块构成;
3、具备图像生成或视觉语言模型微调经验,能独立完成训练数据构建;
4、熟练使用 Python、PyTorch 及 Linux 环境,具备工程化实验流程的能力(脚本化、可复现、可观测);
5、对新技术有强烈好奇心与执行力,能在不确定环境中快速试错、复盘并推进落地。
加分项:
1、深度实践过角色一致性生成、多主体合成与布局控制等关键技术,并具备解决冲突的能力;
2、具备大规模多模态数据处理经验,熟悉数据质量管理与自动化评测体系构建(含身份一致性、图像质量等指标);
3、在生成领域有研究成果(论文/专利)、开源贡献或高质量个人项目(可提供 Demo/代码);
4、具备视觉审美与 Prompt Engineering 能力,能将技术指标有效转化为产品效果。
面议 浙江省杭州市西湖区 全职 本科及以上
2026-03-05 09:39:44
岗位亮点:
• Vibe Coding 驱动开发;
• 直接与创始人搭档:零层级汇报,产品决策链极短,你的想法可以最快速度变成行动;
• 完整的产品所有权:从用户洞察到产品上线,你拥有一条产品线的完整控制权和成果归属;
• 不是一个人摸索:团队已有多位同岗位的全栈产品经理在岗,有充分的学习对象和日常交流机会。
岗位职责:
1、产品全生命周期负责:独立完成AI产品的市场分析、用户需求洞察、产品定位、功能规划、PRD撰写、版本迭代与数据复盘;
2、AI 原生产品设计:以大模型、Agent、工作流为核心进行产品设计,理解 AI 的能力边界与产品化路径,具备提示词工程的基本认知;
3、UI/交互设计输出:独立完成产品原型、交互逻辑与页面结构设计,具备基础UI审美与设计工具使用能力;
4、Vibe Coding 产品实现:借助codex、Claude Code等 AI 编程工具,通过自然语言提示完成业务开发、接口联调与 AI 能力集成,将产品从设计推进到上线;
5、全链路闭环,独立承担:产品定义 → 交互设计 → AI辅助开发 → 测试验证 → 上线发布 → 数据驱动迭代。
岗位要求:
1、具备独立做出完整产品的能力或强烈意愿,能从想法到上线跑完全程;
2、对 AI Native 产品有自己的理解,有实际使用或开发 AI 产品/工具的经历优先;
3、熟悉或愿意深入学习 Vibe Coding 工作流,能借助 AI 工具完成产品的技术实现;
4、自驱力强,适应快速迭代的创业节奏,面对不确定性能主动推进。
加分项:
1、有个人 side project、独立开发作品或参与开源项目经历;
2、活跃于 AI 产品社区,对前沿 AI 工具和产品趋势有持续关注;
3、有内容创作、社区运营或增长相关经验。
我们是一家源自西湖大学深度学习实验室的创新企业,自2021年成立以来,便深耕人工智能多模态大模型技术,致力于将前沿科技转化为产业力量。
创始人蓝振忠,西湖大学特聘研究员、博士生导师。博士毕业于卡内基梅隆大学计算机系,长期致力于自然语言处理、计算机视觉和深度学习的融合与应用研究。曾任谷歌人工智能研究院科学家,多家公司首席科学家 ,是 NLP轻量级预训练语言模型“ALBERT”第一作者,亦是目前国内被最广泛应用的大模型评价指标“CLUE”和“SuperCLUE”的 联合推出人 。
核心自研技术
自主研发的端到端语音模型“心辰Lingo”,集成了语音识别、自然语言处理、意图识别、对话管理以及语音合成等多项前沿技术,实现了从语音输入到语音反馈的完整交互过程。
市场领先的AI产品
凭借在AI领域的深厚积累与持续创新精神,我们已成功推出多款备受欢迎的AI产品,如AI心理咨询平台“聊会小天”、AI智能写作平台“Friday”以及AI绘画平台“造梦日记”等。同时,在海外市场上,“AI Companion” 、“AI 可交互内容”系列也屡获佳绩,月访问量突破千万,居各大AI产品榜单前列。
丰富的B端项目经验
办公时间(节假日除外)
上午:8:30-12:00 下午:13:30-17:30
联系地址
浙江大学紫金港校区西区学生服务中心(尧坤楼)2楼
联系方式
就业招聘相关:电话:0571-87951475,邮箱:zjucareer@126.com
就业指导相关:电话:0571-87952717,邮箱:jy@zju.edu.cn
学生就业相关:电话:0571-87951536,邮箱:jy01@zju.edu.cn
浙大就业微信公众号
请稍候...