职位描述
工作职责:
1、负责模型不同版本、分支效果的文本和多模态评测,输出数据、文字综合的评价和打分;
2、根据模型通用能力优化和设计复杂的prompt,并给到逻辑缜密、得分点分布合理的评测结论;
3、根据行业动态,支持内外部各类调研、摸底、分析需求,输出评测分数和分析;
任职要求:
1、本科及以上学历,新闻、编辑、数学统计、计算机等相关专业;
2、具备大模型项目规则数据分类和分析能力,有通过数据表现反推项目标准优化的思维能力;
3、熟练使用Excel等数据分析工具,具备数据获取、分类和分析能力
4、有良好的表达和团队协作能力,能够有效地与各方沟通和协调,具备结构化的语言表达和文档输出能力
有用户视角,对产品理解深、理解各类场景中用户的诉求,对结果质量和用户满足度敏感,小红书深度用户优先
班次:10-19的班次,周末双休