当前位置:首页>职位列表>职位详情
大模型推理工程师 35000-60000元
深圳南山区 应届毕业生 本科
聚好看科技股份有限公司 2025-04-10 12:58:22 663人关注
职位描述
岗位职责: 1. 负责大模型的端到端部署,包括但不限于推理引擎的开发、模型优化和压缩、模型部署的端到端流程设计等,打造高吞吐、低延时的推理系统; 2. 优化大模型推理性能,提升吞吐并控制成本,提升框架易用性和可调试性。 岗位要求: 1. 熟练掌握 C/C 、Python、GO等编程语言之一,有计算机体系结构背景或软件开发背景,熟悉系统性能调优的方式; 2. 了解主流深度学习框架如tensorflow,pytroch等,有TFServing/OnnxRuntime/FasterTransformer等深度学习推理框架的实际使用经验; 3. 了解微服务架构设计及分布式开发,熟悉K8s、Docker等技术; 4. 具备基础的GPU编程能力,包括但不限于Cuda、OpenCL;熟悉至少一种GPU加速库,如cublas、cudnn、cutlass等; 5. 熟悉各类深度学习网络和算子底层实现细节,训练和推理模型调试、调优有实操经验优先; 6. 熟悉CPU/GPU异构加速瓶颈分析方法,有服务器端 AI 芯片、GPU加速经验优先; 7. 熟悉分布式推理加速框架,有超大模型分布式加速经验优先。
联系方式
注:联系我时,请说是在今日招聘网上看到的。
工作地点
地址:深圳南山区深圳-南山区海信南方大厦海信南方大厦6楼
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕

若您已有简历,可直接登录登录

  • 省份

    注:0表示面议
    获取验证码
    保存并投递
    投递简历
      马上投递
      投递简历
        马上投递

        企业
        服务热线

        • 400-6680-889
        1. 登录
        2. 注册
        客户服务热线:
        400-6680-889
        在线客服:
        点击这里给我发消息 898995850
        工作日:
        8:30-18:00