职位描述
岗位职责:
1、负责云端AI大模型算法的工程化部署和落地工作,包括算法SDK开发与接口封装,算法业务逻辑开发等,集成多种模型至一个解决方案中,实现 AI 项目落地;
2、负责云端AI大模型算法的性能优化工作,包括模型推理加速、算法模块调度优化、模型量化蒸馏等;
3、与业务人员紧密合作,将AI模型集成到公司产品中,并提供技术⽀持和解决⽅案,确保平台的功能需求得到准确实现;
4、基于大规模客户交易数据、产品高质量文本数据,设计并构建细分 场景LLM、AI Agent解决方案,智能营销、智能销售、智能客服等。
任职要求:
1、 全日制本科及以上学历,人工智能/计算机/数学/电子信息等相关专业;
2、3年及以上LLM、NLP、机器学习领域的工作经验,有大模型实际项目经验者优先;
3、熟练使用Python、Pytorch以及 TensorRT等主流算法训练推理框架;
4、专业技能: ①对当前主流LLM如:GPT系列、LLaMA、DeepSeek 等有深入研究,并有实践经验,熟悉LLM预训练、SFT、RLHF完整的训练流程; ② 在基于扩散模型的视频生成、TTS、ASR、多模态等方向有研发经验; ③熟悉prompt工程及常用的SFT数据构建方式,了解 RAG、AI Agent框架; ④良好的逻辑分析能力和数理基础,在复杂业务场景下能够分解和抽象问题,提供优秀、完整、可行的解决方案。
5、工作认真细致,有较强责任心、良好的沟通能力与团队合作精神。