职位描述
主要职责:
1、拆解业务部门需求及问题,从现有业务系统设计提取机制数据
2、使用Python Scikit-learn/XGBoost等工具完成数据模型开发以及训练
3、输出模型评估报告,跟踪模型上线后运行效果并持续迭代优化
4、设计数据采集规则,完成多源数据的清洗、整合与校验
5、数据流程优化,制定高效ETL流程,整理可复用的数据分析资产库
6、搭建BI看板(核心指标、趋势分析、异常预警等),开发用户使用自动化报表
7、组织分析结论沟通会,将业务部门模糊需求用通俗方式呈现并推动落地执行
8、遵循数据安全合规管理规范,建立数据质量校验规则并定时开展数据质量巡检
9、推动业务系统、数据采集环节的优化,从源头提升数据质量
任职要求:
1、数学、统计学、计算机科学、数据科学等相关专业本科及以上学历,5年以上独立数据挖掘 数据分析全流程实战经验,有制造行业成功案例者优先。
2、熟练掌握Python或R等数据分析语言,能独立完成数据预处理、特征工程、模型训练、评估和迭代。
3、掌握经典机器学习算法原理与应用场景,包括分类(逻辑回归、决策树、随机森林、XGBoost、LightGBM)、聚类(K-Means、DBSCAN)、关联规则挖掘(Apriori、FP-Growth)、回归分析等。
4、熟悉数据库技术,熟练使用SQL(MySQL/Oracle/MS SQL等)进行查询与数据提取。
5、掌握Excel高级函数、数据透视表,精通BI可视化工具制作看板(案例介绍)。
6、了解Hadoop、Hive、Spark等大数据处理框架,熟悉数据仓库分层设计逻辑者优先。
7、具备较强的逻辑思维与问题拆解能力,对数据敏感;有良好的数据分析报告撰写能力,以及跨部门沟通表达能力。
8、需具备持续学习新技术、新算法能力。
9、有CDGA/CDGP(数据治理认证)、阿里云 / 华为云大数据工程师认证、TensorFlow 开发者认证等相关证书优先。