IT人力外包人才简历库

返回列表

大数据开发与分析工程师

驻场外包人员
工作年限:4年 意向城市:杭州 浏览:6次 发布时间:近期

技能标签

Apache Spark Apache Flink HiveSQL Kafka HBase Linux Hadoop Python Java 机器学习 数据可视化 数据倾斜优化 实时计算 离线分析 ETL开发 分布式系统

专业技能

精通Apache Spark核心组件(Spark SQL/Spark Streaming/Spark Core)及RDD/DataSet/DAG执行原理,具备离线ETL与实时流式计算开发能力;精通Apache Flink流处理引擎,擅长处理数据倾斜与延迟问题;精通HiveQL数据仓库开发,掌握窗口函数、分桶优化及数据倾斜解决方案;精通Kafka分布式消息系统,熟悉ISR机制与数据一致性保障;熟悉HBase分布式存储架构,具备热点问题优化经验;掌握Linux系统运维及Shell脚本开发;精通Hadoop生态体系(HDFS/YARN/MapReduce)底层原理;熟悉机器学习算法(线性回归/决策树/聚类分析)及特征工程;具备Python/Java/Scala多语言开发能力;熟悉数据采集工具(Flume/Canal/Sqoop)及数据可视化(Superset/Elasticsearch)

工作履历(脱敏处理)

长期从事大数据平台开发与分析工作,主导构建Lambda架构实现用户画像系统,采用多路召回策略提升推荐准确率。设计实时数据处理流水线,通过Flink窗口函数解决延迟问题,使用Kafka保障数据一致性。优化Hive查询性能,通过分桶策略解决数据倾斜问题。开发离线分析平台支持电商商户运营决策,搭建数据可视化系统提升业务洞察效率。具备完整的数据采集(Flume/Canal)、处理(Spark/Hive)及存储(HBase/ClickHouse)解决方案设计能力。

项目经验(脱敏处理)

1. 用户画像与推荐系统:基于Lambda架构构建实时与离线计算体系,采用Spark Streaming处理用户行为数据,Flink实现实时特征计算。通过HiveQL构建用户分群模型(RFM/PSM),结合协同过滤算法提升推荐准确率,降低30%营销成本。

2. 直播销售实时监控:设计Kafka消息队列实现数据实时采集,使用Flink窗口函数处理数据延迟,通过Hive构建统一数据口径。开发可视化看板实时展示商品销售趋势及观众行为分析,提升运营决策效率。

3. 商户离线分析平台:搭建Hadoop集群处理电商日志数据,采用Spark进行离线ETL处理,通过Hive构建多维分析模型。开发可视化报表系统支持商户运营分析,优化查询性能提升数据处理效率40%。

驻场外包优势

服从性高

严格遵守甲方管理制度

技术扎实

4年项目实战经验

可长期驻场

接受异地项目外派

快速响应

24小时内可到岗

企业人才对接

专业IT人力外包服务

如果贵公司有IT项目人手缺口、需要工程师驻场开发、短期人力支援需求,欢迎联系洽谈合作。

合作热线

18969108718

商务邮箱

ntit@163.com

微信扫码咨询

微信咨询二维码

扫描二维码添加商务对接

立即申请人才对接