职位描述
岗位描述:
1、参与搭建机器人领域专属的大模型数据处理平台,支持从采集、清洗、标注、训练到评估的全流程数据闭环;
2、设计与实现高吞吐、可扩展的时序多模态数据处理引擎,服务图像、视频、语音、动作等多模态数据;
3、与算法团队深度配合,基于大模型能力,提取有价值的数据,提升数据质量,深度参与数据驱动下机器人能力的进化;
4、参与模型评估体系建设,从模型训练到模型评测一站式完成,为模型性能提供可靠的数据支持。
任职要求:
1、对机器人系统、人工智能训练、数据平台等方向有浓厚兴趣,愿意深入理解机器人“大脑”的构建逻辑;
2、具备图像/视频/多模态数据处理经验,熟悉数据处理、格式转换、时间同步等处理流程;
3、精通Python或Golang至少一种语言,能够实现高效、可扩展的数据处理工具;
4、熟悉常用图像/视频处理工具链(如OpenCV、FFmpeg、PyAV、MMCV等);
5、熟悉分布式计算或大数据处理框架(如Spark、Flink、Ray、Hadoop等)者优先;
6、有海量数据处理平台、数据调度系统、数据流/批一体框架使用或开发经验者优先;
7、有仿真环境(如IsaacGym/Sim、PyBullet、SAPIEN、MuJoCo)下的处理处理经验者优先。