职位描述
岗位职责
1. 实施推理服务平台产品的容器化部署,优化部署流程,解决部署过程中的技术问题
2. 通过API接口调用模型进行测试和调试;
3. 根据推理服务平台需求,优化客户防火墙配置和安全策略;
4. 帮助客户进行K8S集群的搭建、管理和维护工作;
5. 排查并解决系统运行过程中的各类技术问题;
6. 基于自有推理服务平台构建知识库及agent服务
7. 编写技术文档,提供技术支持和培训;
任职要求
1. 计算机相关专业本科及以上学历,2年以上相关工作经验
2. 熟悉Linux操作系统,精通Ubuntu/redhat/openEular系统中的一个以上,精通容器技术,熟练掌握docker/containerd/podman容器管理,了解不同类型显卡(如NVIDIA、AMD)的特性,问题排查方法及其在AI领域的应用。
3. 熟悉Linux及Windows系统,能够进行模型部署和管理 熟悉网络运维,能够配置防火墙和安全策略
4. 熟悉Kubernetes(K8S)集群的搭建与维护
5. 具备良好的问题分析和解决能力,能够高效处理部署过程中的各类技术问题
6. 良好的团队协作能力和沟通能力,能够编写清晰的技术文档
7. 熟悉Python编程,能够编写自动化脚本提高工作效率
加分项
1. 有大模型部署经验,尤其是开源大语言模型部署经验
2. 有AI基础设施建设经验
3. 了解分布式系统和高可用架构
4. 对于dify, ragflow等AI应用有过使用经验,熟悉AI应用开源项目源码
5. 了解IB,ROCE网络配置