岗位职责
1、从事音频生成预训练算法研究、训练、应用,涉及语音、音乐、音效等方面;
2、负责音频生成模型基于gpu的并行多机多卡训练、高性能模型推理等;
3、熟悉常见的声学模型和声码器,具有相关的开发和研究经验;熟悉声音转换相关算法和技术;熟悉通用合成引擎搭建及优化,具备云上和端上引擎优化经验;
4、将先进的音频生成技术应用于实际业务,更好服务用户;
5、前沿技术跟进研究,支持公司通用类和垂类预训练模型研发及效果持续优化。
任职要求
1、本科及以上学历,计算机、数学或统计学等相关专业,五年及以上语音合成算法相关经验;
2、熟练使用pytorch/tensorflow深度学习框架,扎实的python/c/c++编程功底,有工程化落地经验者优先;
3、在textless音频生成、超自然语音生成或语音生成大模型预训练、微调等方向有较深入研究;
4、有speech顶会发表经验者(neuraips/icassp/interspeech等)优先;
5、具备良好的逻辑思维能力、沟通协作能力、自我学习能力。