职位描述
岗位描述:
1、核心应用开发: 主导AI大模型在企业业务场景的核心应用构建,涵盖AIGC文本与图片生成系统、知识库搭建等关键业务内容,确保应用贴合业务需求,高效运行。
2、业务融合创新: 深入剖析业务需求,设计并优化AI大模型应用,针对不同业务场景进行微调,提升应用准确性与适应性。同时,参与人工智能在业务领域的应用集成,构建大模型应用服务,为数字化交付平台赋能,提供搜索及业务创新应用等关键能力。
3、AI辅助研发支持: 负责AI辅助研发相关应用的全流程开发与维护,包括但不限于AI辅助设计、开发、测试以及智能问答等领域,助力研发效率显著提升。
4、基础技术执行: 承担模块内代码编写、单元测试、静态检查、本地构建、测试环境搭建以及问题定位修复等基础且关键的工作任务,保障项目开发流程的顺畅进行。针对实际业务痛点,进行问题抽象建模,提供具备竞争力的AI应用技术解决方案。
5、技术创新引进: 时刻关注行业前沿趋势,为团队调研并引入新的AI应用场景,推动技术创新与业务拓展。
6、模型能力提升(优先): 投身生成式大模型能力体系建设,参与模型设计优化、prompt工程提升、预训练操作执行、模型加速技术实现以及数据集的扩充与质量把控,全方位提升模型性能(此项为加分项)。
岗位要求:
1、教育背景与基础能力: 本科及以上学历,计算机科学、软件工程或相关专业毕业,具备扎实的计算机科学理论基础与编程能力,熟练掌握Java、Python、JS等主流开发语言中的一种,精通Python者优先。
2、大模型应用开发经验: 具备3年以上软件开发经验,其中至少1年专注于AI大模型应用开发。必须熟悉LangChain、AgentS等大模型应用开发框架,并有实际项目经验。 有生成式AI应用系统(文生文、文生图、多模态等)、检索系统、跨平台应用软件(Windows、Linux)开发经验者优先。熟悉Django、FastAPI等主流开发框架。
3、工程化与部署能力: 了解Docker/Kubernetes容器化部署技术,熟悉Linux环境操作,能够将开发成果高效部署至生产环境。掌握常见的数据结构与算法,具备将AI算法工程化落地的能力,有CV、OCR、NLP等AI领域工程化开发经验者优先。
4、AI技术经验(优先): 拥有AI算法推理部署经验,熟悉常见大模型(如DeepSeek、通义、豆包、文心一言等)及CV模型(如YOLO、ResNet系列)。对大模型技术有深入理解,熟悉Transformers、vLLM、Triton、PyTorch等框架中的1 - 2种,有RAG、Agents、COT相关框架和系统开发经验者优先考虑。
5、综合素养: 了解机器学习、深度学习及自然语言处理的基本概念、算法和模型,掌握软件工程原理与方法,包括需求分析、系统设计、软件测试等,熟悉常用设计模式,能够进行软件架构设计与系统优化。具备较强的学习和动手能力,对新技术有敏锐洞察力,具备初步的流程和质量意识。