其他企业 信息传输、软件和信息技术服务业 200-500人 北京市海淀区
8000-9000 北京市海淀区 全职 本科及以上 1人 2025-12-31
2025-10-15 09:22:58
职位描述:
1.理解产品场景的用户需求,能够按照既定标准,对AI对话及相关场景进行人工评估和标注,确保结果客观、一致、准确
2.参与评测数据集的构建、整理与迭代,保证覆盖全面、场景真实、可持续更新
3.参与评估方案、评估规则的制定、落实与持续优化;收集并整理评测过程中的问题与歧义,推动规则更新迭代,提升规则的覆盖性与适用性
4.对数据与内容敏感,通过对评测数据的整理与分析,总结模型整体表现和典型问题;撰写阶段性评测报告,提出模型优化的改进建议
5.在评估过程中主动思考并提出流程优化建议,持续完善SOP,探索并应用自动化工具,不断提升评估工作的效率与可扩展性
任职要求:
1.本科及以上,文学、语言学、心理学、社会科学相关专业优化,有评测行业经验优化
2.文字功底扎实、理解力强、头脑灵活,具备较强的阅读理解、抽象总结和内容判断能力,能够根据用户需求灵活理解评估标准规则
3. 积极主动,善于发现和定位问题,具备良好的团队协作与沟通协调能力
4.熟练使用 Excel 等常用办公工具,能够高效完成数据处理与结果呈现
职位类别:计算机软、硬件/互联网/IT
专业要求:不限
请稍候...