当前位置: 首页 > web >正文

数据分析岗位-相关知识

数据分析岗位

  • 1.大数据
  • 2.业务(朴素理念)

1.大数据

  • 数据流向 :MySQL等传统业务数据(结构、半结构、非结构) → ETL → 数据仓库 / 数据计算 → BI(BI也提供计算能力)
sequenceDiagramMySQL->>+Kafka: 实时数据变更Kafka->>+Snowflake: 批量加载Snowflake->>BI工具(阿里Quick BI): 分析报表
  • OLTP(Online Transaction Processing在线事务处理)和 OLAP(Online Analytical Processing在线分析处理)是两种主要的数据处理模式
    举个例子:MySQL 之类的关系型数据库,MongDB 之类的NoSQL的OLTP。ES之类的算OLAP。

  • 数仓建设的星型/雪花模型:优化分析查询性能;事实表+维度表;读操作高效。
    关系型数据库范式(123NF):保证数据一致性,减少冗余;多表关联;读写均衡。

星型模型(Star Schema)
graph TD
A[事实表] --> B[维度表1]
A --> C[维度表2]
A --> D[维度表3]雪花模型(Snowflake Schema)
graph TD
A[事实表] --> B[维度表1]
B --> C[子维度表1]
B --> D[子维度表2]

2.业务(朴素理念)

  • 数据本身是客观的,数据分析可以是有视角的(最简单的例子,薪资平均值对外,薪资中位数对内;做图关注加速度和速度,即关注差距还是斜率;朴素数学原理)。
  • 数据需要产生业务价值,所以老板想要较深度的数据分析。
  • 回归到职业力、业务能力、Manage Up、情绪价值
http://www.xdnf.cn/news/2113.html

相关文章:

  • Nginx性能优化:从配置到缓存,全面提升Web服务器性能
  • Datawhale AI春训营二期---使用AI实现老人的点餐效果(关于task2的相关思考)
  • [FPGA Video IP] Video Processing Subsystem
  • 基于Tcp协议的应用层协议定制
  • 软件技术专业
  • CF-Hero:自动绕过CDN找真实ip地址
  • 深入理解 C++ 三法则:资源管理的关键准则
  • Linux基础IO(十一)之动态库(基础IO的最后一篇啦!)
  • 智能座舱背后的秘密:智能座舱测试如何“具身智能”
  • Golang | 自行实现并发安全的Map
  • 在 WSL 安装 OpenFOAM-12
  • 【软件工程】TCP三次握手中的SYN与ACK:核心机制详解
  • 使用ast解ob混淆时关于types的总结
  • leetcode刷题日记——简化路径
  • AI与思维模型【79】——煤气灯效应
  • 深入解析Mlivus Cloud核心架构:rootcoord组件的最佳实践与调优指南
  • 【金仓数据库征文】交通行业的国产化数据库替换之金仓数据库KingbaseES应用实践
  • 【风控】稳定性指标PSI
  • 基于STM32、HAL库的MAX31865模数转换器ADC驱动程序设计
  • 消息队列mq在Mlivus Cloud向量数据库中的关键配置与最佳实践
  • C++智能指针概念理解的面试题
  • window.location.href的用法
  • 基于 Netmiko 的网络设备自动化操作
  • 《逐梦九天:中国航天编年史》
  • QT文本框(QTextEdit)设置内容只可复制粘贴
  • C++:继承机制详解
  • Cursor 配置 MCP Tool
  • 写在后面的话
  • yolo常用操作(长话短说)热力图,特征图,结构图,训练,测试,预测
  • 打开Qt应用程序以控制台