职位描述
### **岗位名称**
**大模型后端接口开发工程师**
**薪资范围:** 25K-45K/月(能力定薪,优秀者面议)
**工作地点:** 北京/上海/深圳/杭州(可谈远程协作)
---
### **岗位职责**
1. 设计与开发大语言模型(LLM)后端API接口,支撑亿级用户请求的高并发场景
2. 优化大模型推理服务性能,通过分布式架构、量化压缩等技术降低服务延迟与成本
3. 构建自动化监控体系,保障接口服务的稳定性(SLA 99.99%)
4. 设计鉴权、限流、负载均衡等安全防护机制,保障企业级服务安全
5. 与算法团队紧密协作,推动模型版本迭代与接口服务的无缝升级
---
### **任职要求**
**核心技能:**
- 3年以上后端开发经验,精通Python/Go/Java中的至少一门语言
- 深入理解RESTful/gRPC接口开发,有高并发服务开发经验(熟悉FastAPI/Flask/Django框架)
- 熟悉Kubernetes/Docker云原生架构,具备大规模分布式系统调优经验
- 了解大模型技术栈(如LangChain、vLLM、Triton Inference Server等框架)
- 具备模型服务化经验者优先(TensorFlow Serving/TorchServe/TRT-LLM等)
**加分项:**
- 有LLM API商业化落地经验(如OpenAI API兼容开发)
- 熟悉大模型推理优化技术(动态批处理、持续批处理、PagedAttention等)
- 参与过开源AI项目贡献或技术社区活跃者
---
### **我们提供**
🔥 **技术成长**:
- 零距离参与千亿参数大模型工程化实践
- 每年3次技术晋级通道,标配RTX 4090/A100开发机
- 定期硅谷技术连线交流
💼 **极致福利**:
- 弹性工作制(核心工时11:00-16:00)
- 全额缴纳六险一金 补充商业保险
- 年度健康体检 心理健康服务
- 技术图书自由采购预算
🌍 **未来权益**:
- 参与AI产品商业化收益分成
- 优先获得海外研发中心轮岗机会
- 年度带薪参会预算(CVPR/NeurIPS等顶会)
---