大模型评估-全流程
6000-8000元/月
更新 2026-01-04 12:07:58
浏览 582
职位详情
数据标注/AI训练师
经验不限
【职位描述】
1、结合业务目标参与评测体系的设计与优化,构建评估数据集,从用户和模型双重视角出发,设计理想回答并细化评估维度;
2、运用人工或自动化手段对模型输出或搜索结果开展定性与定量分析,能系统性拆解全链路环节,协助产研团队识别问题并推进改进措施;
3、通过编写PE脚本或搭建流程化工具推动评估流程自动化,提高团队评测工作的效率与准确度;
【岗位要求】
1、985或211院校本科及以上学历,硕士学历可适当放宽条件,具备大模型项目经验者优先考虑;
2、在多个垂直领域有广泛积累,能够深入分析专业性或行业性问题,并形成独立判断;
3、具备良好的信息检索习惯或大模型产品使用经验,擅长从用户角度发现体验痛点,善于融合多维度视角进行问题剖析,有竞品研究经历者优先;
4、对数据与文本高度敏感,具备出色的文字理解、归纳总结及数据分析能力者优先;
5、工作细致认真,具备较强的沟通协作能力、执行能力、复盘意识及抗压能力
1、结合业务目标参与评测体系的设计与优化,构建评估数据集,从用户和模型双重视角出发,设计理想回答并细化评估维度;
2、运用人工或自动化手段对模型输出或搜索结果开展定性与定量分析,能系统性拆解全链路环节,协助产研团队识别问题并推进改进措施;
3、通过编写PE脚本或搭建流程化工具推动评估流程自动化,提高团队评测工作的效率与准确度;
【岗位要求】
1、985或211院校本科及以上学历,硕士学历可适当放宽条件,具备大模型项目经验者优先考虑;
2、在多个垂直领域有广泛积累,能够深入分析专业性或行业性问题,并形成独立判断;
3、具备良好的信息检索习惯或大模型产品使用经验,擅长从用户角度发现体验痛点,善于融合多维度视角进行问题剖析,有竞品研究经历者优先;
4、对数据与文本高度敏感,具备出色的文字理解、归纳总结及数据分析能力者优先;
5、工作细致认真,具备较强的沟通协作能力、执行能力、复盘意识及抗压能力
相似职位
很抱歉,暂无相似职位!