其他企业 信息传输、软件和信息技术服务业 500人以上 广东省深圳市南山区
面议 广东省深圳市南山区 实习 本科及以上 10人 2026-05-31
2026-04-03 08:56:18
模型推理研究方向
1. 开源推理框架深度掌握与性能攻坚:系统学习并精通vLLM等主流开源推理框架,全面掌握其全链路技术栈(从Web API接口层、核心调度逻辑到硬件适配层),能独立定位推理过程中的性能瓶颈(如KV缓存效率、批处理调度、硬件资源争用等),并通过参数调优、逻辑适配或轻量改造实现问题修复与性能提升。
2. 业务导向的推理技术调优与加速:聚焦业务场景(如RAG、智能体对话)的推理需求,主导模型推理技术的调优与加速实践,核心目标包括提升QPS(每秒查询数)、降低资源消耗(如GPU利用率优化、显存占用压缩)、压缩端到端延迟(如首字响应时间TTFT、生成吞吐量),输出可落地的性能优化方案。
3. 场景化推理框架深度定制:结合业务实际需求,对推理框架进行场景化深度定制,涵盖自训练模型的推理适配(如非标准架构接入、量化/蒸馏后模型兼容性优化)、开源模型的性能调优(如针对长序列输入的PagedAttention策略调整)及功能扩展(如集成业务监控指标、适配私有协议API),确保框架与业务场景高度契合。
多模态大模型算法研发方向
1. 多模态大模型前沿技术跟进。
2. 垂域大模型算法开发(含数据治理、Benchmark构建、模型训练等)。
3. 大模型算法技术研究(训练范式、模型结构、损失计算等)。
模型推理研究方向
1. 硕士及以上学历。
2. 具备扎实的机器学习、深度学习基础,熟悉经典大模型,了解前沿大模型。
3. 良好的英文阅读能力,能够快速阅读和理解专业英文文献。
4. 拥有责任心和团队合作精神、良好的沟通能力和学习能力,对算法技术具有热情。
5. 熟悉python开发;熟悉Linux系统、熟悉大模型训练框架者优先。
6. 具有相关项目/论文/竞赛/实习经历者优先。
多模态大模型算法研发方向
1. 硕士及以上学历。
2. 扎实的机器学习、深度学习基础,熟悉经典大模型,了解前沿大模型。
3. 良好的英文阅读能力,能够快速阅读和理解专业英文文献。
4. 良好的沟通能力和学习能力,对算法技术具有热情。
5. 具有相关项目/论文/竞赛经历者优先。
请稍候...