职位描述
工作内容:
1、使用Hadoop Hive,负责公司离线数据系统开发;
2、使用Spark,负责公司实时数据处理相关的关键产品模块开发;
3、使用Java/Python,负责封装数据服务API;
4、参与数据平台开发规范制定,数据建模及核心框架开发;
5、校验数据准确性,并能完成数据差异/异常的解释。
职位要求:
1、本科及以上学历,计算机等理工科相关专业;
2、熟练掌握使用SQL,熟悉数仓建模理论;
3、对Hive及Spark系统调优有一定经验;
4、能够使用Python、Java或Scala等主流编程语言;
5、对数据工程有热情。