1.1 主要职责
1)大模型算法研发与优化:
①负责大模型的训练、微调与优化,结合实际业务需求提升模型性能;
②研究并实现知识图谱、知识库的构建与维护,支持大模型的知识增强能力;
③开发知识增强的多轮问答系统,优化检索与生成模块的性能,提升问答准确率与用户体验。
2)大模型微调技术研究:
①熟练掌握大模型的微调技术,并进行深入研究与创新;
②探索高效微调方法,降低大模型在特定任务上的训练成本与资源消耗;
③结合实际场景,设计并实现定制化的微调方案。
3)大模型部署与应用:
①负责大模型的部署与推理优化,确保模型在高并发场景下的高效运行;
②研究模型压缩与加速技术(如量化、剪枝、蒸馏等),提升大模型的推理效率;
③推动大模型在产品中的应用,解决实际业务问题。
4)技术调研与创新:
①跟踪大模型领域的前沿技术,结合实际业务需求进行技术调研与创新;
②参与技术方案的制定与评审,推动团队技术能力的提升。
工作时间:周一至周五8:30-16:30,午休1小时;周末双休
1.2 任职要求
1)学历要求:硕士研究生及以上学历,985/211本科,计算机科学、人工智能、电子工程、自动化等相关专业。
2)工作经验:
①3-5年大模型、自然语言处理、知识图谱等相关领域的研究或开发经验;
②具备知识图谱、知识库构建及RAG问答系统的实际项目经验。
3)技术能力:
①熟悉业界主流大模型(如GPT、BERT、T5、LLaMA等)的算法原理与实现细节;
②熟练掌握大模型的微调技术,包括但不限于Adapter、LoRA、Prompt Tuning、Prefix Tuning等。
③熟悉大模型的训练框架(如PyTorch、DeepSpeed、Megatron-LM等),具备大规模分布式训练经验;
④熟悉模型压缩与加速技术(如量化、剪枝、蒸馏等),具备大模型部署与推理优化经验;
⑤具备知识图谱、知识库构建及RAG问答系统的开发经验,熟悉相关工具与框架(如Neo4j、Elasticsearch、FAISS等)。
1.3 其他要求:
1)具备良好的代码能力,熟练掌握Python/C ,具备良好的编程习惯;
2)具备较强的学习能力与问题解决能力,能够独立完成技术调研与开发;
3)具备良好的团队协作能力与沟通能力,能够与跨部门团队紧密合作。
4)加分项:
①在重要国际学术会议(如CVPR、ICCV、ECCV、NeurIPS等)发表过相关论文;
②具备大规模数据集处理与分布式训练经验;
③有端侧实际产品落地经验,熟悉从算法研发到上线的完整流程;
④有教育行业开发经验。