职位描述
岗位职责:
1.负责大模型训练与推理平台的搭建、维护、性能优化与日常运维,支持模型的快速迭代与实验管理。
2.实现AI系统与指控系统、仿真平台、数据链等现有业务系统的集成、联调与数据对接。
3.开发数据处理、AI算子模型服务、评估监控等MLOps流水线组件,提升系统自动化水平与研发效率。
4.参与模型压缩、量化、加速等推理优化工作,提升系统在边缘计算设备等资源受限环境下的部署能力。
5.编写系统部署、接口规范、运维手册等技术文档。
6.支持系统的试验验证、现场部署与保障,确保系统在生产环境中稳定、可靠运行。
任职要求:
1.计算机、软件工程、人工智能、电子信息等相关专业,5年以上AI系统开发或部署经验,熟悉大模型训练与推理流水线的构建与优化。
2.熟练掌握Python/C ,熟悉Linux开发环境,具备丰富的分布式系统、容器化(Docker/K8s)与MLOps实践经验。
3.精通主流AI框架与工具链(如PyTorch,TensorFlow,Hugging Face,LangChain等)。
4.具备丰富的分布式系统、容器化(Docker/K8s)与MLOps实践经验。
5.具备良好的团队协作、问题解决与抗压能力,能承担系统调试、性能优化与线上故障排查等任务。