当前位置:首页>职位列表>职位详情
高级AI系统开发工程师(大模型与RAG方向)(A18742) 25000-30000元
武汉洪山区 应届毕业生 本科
小米科技有限责任公司 2025-09-20 15:28:56 14人关注
职位描述
职位描述: 1. 主导大模型系统架构设计: 负责RAG系统的整体架构设计,包括存储层、检索层、推理层与缓存层的技术选型与实现。 构建高可用、低延迟的分布式推理服务框架,支持向量数据库集成(如Milvus、Elastic)、知识库管理与多模态检索优化。 设计并实现Agent工作流编排框架,支持工具调用(MCP协议)、任务规划与自动化执行。 2.模型部署与性能优化: 负责大模型(LLM/VLM)的本地化部署、量化压缩、动态批处理与推理加速,优化GPU/CPU异构算力利用率。 3. AI服务平台开发: 基于Java/Go/Python构建高并发、可扩展的AI微服务,与现有业务系统深度集成,实现模型训练-部署-监控的全链路管理。 4.技术领导与跨团队协作: 指导中级工程师,制定技术方案,并主导技术攻关。与产品、算法、基础设施团队协作,定义需求并推动工程落地。 职位要求: 1.计算机科学、人工智能或相关领域本科及以上学历,5年以上大型服务端开发经验,3年以上AI系统相关项目经验 2.有牵头大型AI工程项目经验,具备一定的团队管理或技术领导经验 3. 具备扎实的 Java 编程基础,熟悉常用的 Java 开发框架,包括不限于Spring,SpringMvc、SpringBoot、Spring Cloud,有高并发分布式系统开发经验 4. 熟悉常用数据库,包括不限于Mysql、MongoDB、ES、Redis等,熟悉常用的消息中间件 5. 熟悉python/GO开发语言,能进行一般的python/Go项目开发 6. 能够快速理解业务需求,具备良好的沟通能力,将业务需求准确转化为技术方案 7. 善于学习和总结,有团队合作精神和较强执行力,较强的问题解决能力、跨团队沟通能力和技术规划能力。 【加分项】 ​1. 精通Transformer架构、RAG技术栈、向量数据库优化与多模态检索策略者优先。 ​2. 掌握vLLM/SGLang/TensorRT-LLM推理框架中至少一种模型部署方法,掌握模型量化、算子融合、投机采样等优化技术者优先。 3. 对AI技术前沿(如Agent、多模态)有持续跟踪热情者优先。
联系方式
注:联系我时,请说是在今日招聘网上看到的。
工作地点
地址:武汉洪山区武汉-洪山区小米武汉总部武汉小米总部
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕

若您已有简历,可直接登录登录

  • 省份

    注:0表示面议
    获取验证码
    保存并投递
    投递简历
      马上投递
      投递简历
        马上投递

        企业
        服务热线

        • 400-6680-889
        1. 登录
        2. 注册
        客户服务热线:
        400-6680-889
        在线客服:
        点击这里给我发消息 898995850
        工作日:
        8:30-18:00