其他 制造业 湖南省长沙市开福区
12000以上 湖南省长沙市岳麓区 全职 硕士 2人 2025-10-31
2025-09-19 09:21:54
3、深入探索模型压缩、量化、蒸馏等前沿技术,致力于提升模型的推理效率及部署能力。通过模型压缩技术减少模型参数量,在不显著损失性能的前提下,降低模型存储需求和计算成本。运用量化技术将模型参数从高精度数据类型转换为低精度,加速推理过程。开展模型蒸馏工作,将复杂大模型的知识迁移至轻量级小模型,实现模型在资源受限环境下的高效部署,如移动端、边缘设备等。
1、硕士及以上学历,在计算机科学、人工智能、数学等相关领域接受过系统深入的教育,具备扎实的理论基础,能够深入理解和研究复杂的大模型技术;
2、计算机科学、人工智能、数学、统计学等相关专业背景,拥有深厚的专业知识储备,涵盖算法设计、数据处理、数学建模等方面,为开展大模型研发工作提供有力支撑;
3、精通深度学习基本理论,对神经网络架构、优化算法、损失函数等有深入理解,能够将理论知识灵活应用于大规模语言模型的研发实践中;
4、熟练掌握 Python 编程语言,具备良好的编程习惯和代码调试能力。精通至少一种主流深度学习框架,如 TensorFlow 或 PyTorch,能够熟练运用框架实现模型架构设计、训练、优化及部署等全流程操作;
5、深入理解大规模语言模型的架构设计、预训练、微调等核心技术,熟悉参数调优、损失函数设计、注意力机制等关键环节的优化方法。掌握模型压缩、量化、蒸馏等技术,能够有效提升模型的推理效率和部署能力;
6、具备强大的数据处理能力,熟练掌握数据预处理、数据标注、数据增强等技术,能够处理大规模、高维度的文本数据,为模型训练提供高质量的数据支持;
7、拥有深厚的数学功底,精通线性代数、概率论、数理统计等数学知识,能够运用数学方法解决模型训练和优化过程中的复杂问题,如模型性能分析、参数估计等;
8、具有丰富的大规模语言模型研发项目经验,至少主导或参与过一个完整的大规模语言模型项目,在模型架构设计、预训练、微调、性能优化等方面取得过显著成果。有成功应用模型压缩、量化、蒸馏等技术提升模型推理效率和部署能力的实践经验,能够将模型有效应用于实际业务场景,为企业创造价值。
职位类别:计算机软、硬件/互联网/IT
专业要求:工学
请稍候...