职位描述
岗位职责:
1. 负责设计和实现高性能、低延迟的多路音视频采集、预处理、编码、解码、存储及传输的核心模块。
2. 主导对 FFmpeg、GStreamer、WebRTC 等开源多媒体框架的深入研究、定制化移植、C 封装和深度性能调优,以满足产品特定需求。
3. 深入挖掘 V4L2、ALSA、DRM/KMS 等Linux内核子系统潜力,并充分利用硬件编解码器(如 NVIDIA NVENC/QSV、海思/安霸/瑞芯微芯片方案)、AI加速单元等资源进行性能极致优化。
4. 开发和完善基于 RTMP、RTSP、SRT、WebRTC、QUIC 等协议的流媒体传输模块,解决弱网环境下的卡顿、高延迟问题,提升用户体验。
5. 负责云端音视频关键服务(如实时音视频(RTC)、云端转码(Transcoding)、云端录制(Recording)、云端合流(Mixer)、云端AI推理(Inference))的模块设计、开发与性能极致优化,应对高并发场景。
6. 负责Linux/RTOS环境下音视频SDK的架构设计、开发与维护,确保与驱动层的高效协同,并支持跨平台(如Linux, Android)的部署与适配。
7. 跟踪业界最新技术(如AV1、低延迟编码、端侧AI超分/降噪),进行技术预研和原型验证,并将成果落地到产品中。
8. 编写核心代码,参与代码审查,构建自动化测试用例,保障音视频功能的质量和稳定性。
任职要求:
1. 计算机相关专业本科及以上学历,8年以上C/C 开发经验,其中至少5年专注于音视频领域。
2. 精通C和现代C (C 11/14/17),熟练掌握面向对象编程、模板、多线程并发编程、异步编程及性能分析工具(如 perf, gprof, vtune)。
3. 精通视频编解码标准(H.264/H.265/AV1)、音频编解码(AAC/OPUS)、容器格式(MP4/TS/FLV)的原理,有用C 实现过编解码器、协议处理、滤镜处理等核心模块的实际经验、而不仅仅是调用API。
4. FFmpeg 或 GStreamer 框架的源码结构,有二次开发、定制和优化经验。精通 Linux 环境下音视频开发技术,如 V4L2(摄像头采集)、ALSA(音频采集/播放)、DRM/KMS(显示)等。
5. 拥有丰富的硬件编解码器(如Intel QSV, NVIDIA NVENC/NVDEC, 芯片平台VPU) 集成和调优经验。
6. 具备强烈的性能优化意识,能熟练使用工具定位并解决性能瓶颈(CPU、内存、I/O)。
7. 熟悉 RTMP、RTSP、SRT、WebRTC 等流媒体协议,有网络传输优化(抗丢包、拥塞控制、码率自适应)经验。
8. 加分项:
◦ 有Camera ISP图像调试、视频质量评估(VMAF/PSNR)经验。
◦ 熟悉计算机视觉(OpenCV)或深度学习框架(TensorFlow Lite, ONNX Runtime),有在端侧部署AI推理模型(如人形检测、超分辨率)的经验。
◦ 具备嵌入式Linux/RTOS开发调试经验,熟悉交叉编译、Yocto Buildroot等构建系统。
◦ 熟悉CI/CD流程和工具(如Jenkins, GitLab CI)。
9. 具备优秀的逻辑思维能力、技术攻关能力和自主学习能力,对音视频技术有浓厚兴趣和热情,有良好的团队沟通和协作精神。