寒序科技(北京)有限公司

其他企业 信息传输、软件和信息技术服务业 50人以下 北京市海淀区

招聘信息

  • AI大模型算法工程师/实习生

    面议 北京市海淀区 全职 本科及以上 2人 2026-12-31

    收藏

    2026-03-13 10:22:49

    职位描述

    (一)岗位职责

    1)负责 0.6B–8B 规模大模型的训练、微调与评测,包括指令微调(SFT)和对齐(RLHF/DPO),在真实业务场景中构建训练数据与任务体系;

    2)参与模型结构与训练策略优化,包括 Tokenizer、Attention 结构、长上下文处理、推理优化等方向,提升模型在特定任务中的效果与效率;应用如Linear Attention、Engram等新型模型技术训练方案;

    3)与工程团队协作,利用量化、剪枝、蒸馏等技术优化模型负载,根据计算流程具体优化算子/模型结构;

    4)跟踪大模型与 AI 对齐前沿进展,沉淀为技术报告、实验记录或可复用代码模块,并参与论文、专利或开源项目的撰写与发布。

    (二)任职要求

    1)优秀的本科及以上应届毕业生或青年工程师,计算机/人工智能/数学/物理/电子等相关方向;具备良好的技术表达能力:能阅读英文论文、撰写实验报告并实现可复现代码;

    2)扎实的机器学习与深度学习基础,熟悉 Transformer 架构及主流大模型(LLaMA/Qwen等)的训练或推理机制;

    3)熟练使用 Python,具备 PyTorch 训练开发经验,深入理解 Transformer 架构及常见 LLM 的内部原理,具备大模型微调项目经验,熟悉 HuggingFace 生态;

    4)了解大模型微调与推理优化方法,如 LoRA/QLoRA、蒸馏、量化、推理加速、长上下文优化等,对模型部署和系统性能有基本理解。

    (三)加分项

    1)具备0.5B–3B小规模大模型训练或高效微调经验,能够在有限算力下优化模型效果与推理效率;具备端侧模型部署经验;

    2)具有 Linear/Hybrid Attention(如 RWKV, Mamba, Deltanet等)微调或结构优化实战经验

    3)在 NeurIPS/ICML/ICLR/ACL/CVPR等会议发表或在投论文,或拥有高质量开源项目、技术博客或竞赛成果。

    职位类别:计算机软、硬件/互联网/IT

    专业要求:工学,理学

    招聘链接:https://app.mokahr.com/campus-recruitment/hanxu/144645?locale=zh-CN#/

单位简介

寒序科技是一家为云计算提供专用算力的芯片研发企业,孵化于北京大学物理学院应用磁学中心,致力于从新物理原理和非硅基材料上颠覆传统计算架构。

我们的概率计算芯片基于自旋电子学新原理器件——随机磁性隧道结,利用自旋进行基于马尔科夫链和蒙塔卡洛的高性能伊辛求解计算。

我们提供的算力可以迅速部署于药物研发、金融、交通、通信、AI、区块链以及航空航天和军工等场景下的组合优化相关问题。

我们在专用领域计算速度、能耗优势将远超 CPU、GPU、超算,媲美未来量子计算机。相比量子计算,我们是室温的、稳定的、CMOS 兼容且可拓展的,在成本和更大规模计算上优于绝热量子计算机,体现“概率优越性”。

联系方式

  • 联系人:倪博
  • 联系电话:15867284599
  • 电子邮箱:icycampus@icy.tech
  • 传真:寒序科技(北京)有限公司

公司地址

  • 地址:北京市海淀区
  • 邮编:100083

请稍候...