当前位置: 首页 > backend >正文

简历模板2——数据挖掘工程师5年经验

姓名 / Your Name

数据挖掘工程师 | 5年经验 | 推荐/风控/图模型
📞 138-XXXX-XXXX | ✉️ your.email@example.com | 🌐 github.com/yourname | 📍 北京


🎯 个人简介 / Summary

5年大厂数据挖掘经验,硕士学历。擅长推荐系统、用户画像、图神经网络及反欺诈建模,具备扎实的机器学习与工程实践能力。主导多个线上模型从0到1落地,提升业务核心指标。熟悉数据全流程处理,具备从特征设计到模型部署、AB测试的全链条经验。


💼 工作经历 / Work Experience

高级数据挖掘工程师

字节跳动 | 推荐技术部门
2021.08 – 现今,北京

  • 参与短视频推荐排序算法设计与优化,主导多任务学习模型(DeepFM + MMoE)上线,点击率提升12.3%;
  • 构建用户画像系统,涵盖静态属性、兴趣聚类、动态行为标签,支撑推荐/广告/风控三大系统;
  • 联合平台团队建立特征服务系统,支持日均百亿级请求,稳定性达99.99%;
  • 跨部门推进 AB 实验平台优化,实现AB测试自动分流+指标归因分析。

数据挖掘工程师

美团 | 风控与调度技术组
2018.07 – 2021.07,北京

  • 主导“虚假商户识别”图挖掘项目,引入 GAT 图神经网络,准确率提升至91%,上线后每月拦截恶意商户300+;
  • 参与骑手调度优化项目,构建包含天气/订单/区域热度等多源特征体系,提升调度模型效率,配送时间下降8.5%;
  • 搭建基于 Hive + Airflow 的特征流水线系统,实现建模样本生成标准化、自动化。

🧪 项目经历 / Selected Projects

内容推荐排序优化模型(字节跳动)

  • 建立基于用户短期兴趣的推荐排序模型,采用 Transformer + DeepFM 架构;
  • 通过样本采样、重加权缓解曝光偏差,模型效果稳定,AB实验点击率提升12%+;
  • 推动线上部署,模型影响覆盖日均用户超2亿。

用户画像系统重构(字节跳动)

  • 基于用户行为、社交关系构建图结构,用 GCN 聚类兴趣簇;
  • 标签系统统一30+维度,接入推荐、广告和反作弊系统;
  • 实现标签异步更新机制,降低资源开销30%。

虚假交易识别系统(美团)

  • 构建交易网络图,引入 GAT 进行节点表示学习;
  • 使用无监督图聚类方法发现潜在团伙,结合规则系统实时拦截;
  • 系统部署后,整体识别准确率提升至91%,极大降低用户投诉率。

🏆 竞赛经历 / Competitions & Awards

  • 🥈 Kaggle - Santander Customer Transaction Prediction(Top 2%)
    构建堆叠模型 + 特征组合策略,团队协作完成200+特征筛选与融合。

  • 🥉 阿里天池用户增长算法大赛 全国三等奖
    提出 LightGBM + 用户行为时间窗特征方案,精度显著优于baseline。

  • 🎖️ “中国研究生数学建模竞赛” 国家二等奖


🎓 教育背景 / Education

北京航空航天大学
硕士,计算机科学与技术 | 2016.09 – 2018.06

山东大学
学士,信息管理与信息系统 | 2012.09 – 2016.06


🧠 技能清单 / Skills

  • 编程语言:Python(Pandas, Numpy, Sklearn, PyTorch), SQL, Shell
  • 模型方法:XGBoost, LightGBM, DeepFM, GNN(GAT/GCN), MMoE, Transformer
  • 平台工具:Hive, Spark, Airflow, TensorFlow Serving, Docker, Faiss, Kafka
  • 领域经验:推荐系统、反欺诈检测、图建模、特征工程、AB实验

📃 补充信息 / Additional

  • 英语水平:CET-6,具备良好的技术文档阅读能力;
  • 技术博客作者,撰写30+篇机器学习实战笔记(yourblog.com);
  • 开源项目参与者,贡献于 RecBole / DGL 图学习框架。
http://www.xdnf.cn/news/14221.html

相关文章:

  • DataX Hive写插件深度解析:从数据写入到Hive表关联实战
  • 【Flutter】Widget、Element和Render的关系-Flutter三棵树
  • 写出优秀的 Git 提交信息:一份详尽指南(Angular 风格)
  • CS144 lab0: warmup
  • 嵌入式 STM32 开发问题:烧录 STM32CubeMX 创建的 Keil 程序没有反应
  • Flutter动画与交互:打造流畅用户体验的完整指南
  • 基于GNU Radio Companion搭建的AM信号实验
  • 项目拓展-Apache对象池,对象池思想结合ThreadLocal复用日志对象
  • 前端面试专栏-主流框架:7. React核心概念(组件、JSX、状态管理)
  • JAVA-了解网络编程
  • QNAP威联通NAS配置SFTP与内网穿透技术实现远程文件访问
  • Docker 部署 RomM 指南:打造私有戏库与即点即玩系统
  • 31-Oracle 23 ai-Unrestrict Parallel DML(无限制并行DML)
  • 支付宝转账怎么测试?
  • 《B4A安卓开发实战秘籍》
  • logger2js - JavaScript日志与调试工具库
  • 静态库和共享库(动态库)的编译链接
  • Abaqus控制网格的方法
  • 测试开发-正交法
  • CRASIM输入输出变量中英文对照
  • 如何打造沉浸式文件操作体验
  • linux用反汇编分析访问空指针问题
  • Springboot短视频推荐系统b9wc1(程序+源码+数据库+调试部署+开发环境)带论文文档1万字以上,文末可获取,系统界面在最后面。
  • legged_control足式机器人控制框架及代码解析(三):legged_interface NMPC接口
  • ReentrantLock的lockInterruptibly有什么用
  • 【二叉树】(四)二叉搜索树的基础修改构造及属性求解1
  • Java 小工具 - 节假日判断(包含周末),并提供离线版和在线版
  • 《单光子成像》第三章 预习2025.6.13
  • java集合篇(五) ---- List接口
  • 【技术追踪】用于 CBCT 到 CT 合成的纹理保持扩散模型(MIA-2025)