当前位置：首页 > ds >正文

转行数据分析师，愿望是进大厂

ds 2025/7/20 21:34:14

数据分析师常见面试题学习

01集数据分析基础
- Q1你是怎么理解数据分析的?流程如何
- Q2你认为数据分析的价值如何体现
- Q3指标的异常波动变化(例如日活下跌)如何分析
- Q4注册类和活跃类指标，你会看哪个
- Q5用Python设计算法实现圆周率的计算
- Q6估算一个星巴克门店的销售额
- Q7你理解的指标是什么?有哪些组成部分
- Q8指标和维度的区别和联系
- Q9什么是北极星指标?什么是虚荣指标
- Q10什么是指标体系?如何建立?业务应用场景
- Q11什么是A/Btest?核心原理和应用场景
- Q12A/Btest如何合理分流
- Q13如何验证A/Btest的结果
- Q14什么是漏斗分析?有哪些注意的点
- Q15数据分析这么枯燥，你为什么想做呢
- Q16你怎么理解统计学?生活中统计学应用举例
- Q17什么是EDA(ExploratoryDataAnalysis)
- Q18计算西瓜视频内容好评率
- Q19使用ABTest评估算法效果
- Q20如何评估一场活动的效果
- Q21用户网购行为分析
- Q22销售额下降了如何分析
- Q23估算一个星巴克门店的销售额
- Q24什么是同比、环比，意义是什么
- Q25什么是相关性分析?相关和因果的区别是什么
- Q26什么是聚类?业务应用场景?常见算法
- Q27什么是分类?业务应用场景?常见算法
- Q28什么是回归?业务应用场景?常见回归算法
- Q29时间序列预测的原理是什么?有哪些应用场景
- Q30、时间序列预测需要注意的点?和回归有何区别
- Q31回归预测和时间序列预测的区别:
- Q32不用任何公开参考资料，估算今年新生儿出生数量
- Q33如果次日用户留存率下降了5%该怎么分析
- Q34类比到头条的收益，头条放多少广告可以获得最大收益，不需要真的计算，只要有个思路就行
- Q35APP激活量的来源渠道很多，怎样对来源渠道变化大的进行预警?
- Q36用户刚进来APP的时候会选择属性，怎样在保证有完整用户信息的同时让用户流失减少?
- Q37如何识别作弊用户(爬虫程序，或者渠道伪造的假用户)
- Q38一个网站销售额变低，你从哪几个方面去考量?
- Q39用户流失的分析，新用户流失和老用户流失有什么不同?
- Q40GMV升了20%怎么分析?
- Q41如果现在有个情景，我们有一款游戏收入下降了，你怎么分析

01集数据分析基础

今天我找到了一些数据分析的常见面试题，按我的见识回答一下这些面试题，如有错误请大佬指正，谢谢！

Q1你是怎么理解数据分析的?流程如何

数据分析是通过收集、处理和解释数据来获取洞察，并利用这些洞察支持决策制定的过程。它包括以下几个步骤：

定义问题：明确分析的目标或需要解决的问题
数据收集：从不同来源（如数据库、APIs等）收集相关数据
清洗数据：清理数据中的错误、重复值和缺失值，确保数据质量。
探索性数据分析（EDA）：使用统计图表和描述性统计方法初步了解数据特征。
模型构建与验证：根据业务需求选择合适的模型进行训练，并使用测试集验证模型性能
结果解读与报告：将分析结果转化为可操作的见解，并以易于理解的方式呈现给利益相关者

Q2你认为数据分析的价值如何体现

数据分析的价值体现在多个方面：

提高决策质量：基于数据而非直觉做出更加精准的决策
优化运营效率：识别瓶颈并优化流程，降低运营成本
提升客户满意度：通过用户行为分析改善产品和服务
发现新机会：识别市场趋势和消费者偏好变化，开拓新的商业机会

Q3指标的异常波动变化(例如日活下跌)如何分析

首先，确认数据准确性，排除数据采集或处理错误。接着，采用时间序列分析法观察长期趋势；对比同期历史数据以判断季节性因素影响。进一步地，可以细分用户群体查看是否特定群组受影响更大。最后，结合外部事件（如竞争对手活动、节假日等）综合分析原因。

Q4注册类和活跃类指标，你会看哪个

两者都很重要，但关注点取决于具体业务目标。注册类指标（如新增用户数）反映市场拓展效果，适合用于评估获客策略。活跃类指标（如DAU/WAU/MAU）则衡量用户的参与度，有助于了解产品健康状况及用户粘性。通常建议同时监测这两类指标，以便全面掌握业务状态。

Q5用Python设计算法实现圆周率的计算

一般这种很少，但是我这里也去找了Python代码，仅供参考

import randomdef estimate_pi(n):num_point_circle = 0num_point_total = 0for _ in range(n):x = random.uniform(0, 1)y = random.uniform(0, 1)distance = x**2 + y**2if distance <= 1:num_point_circle += 1num_point_total += 1return 4 * num_point_circle / num_point_totalprint(estimate_pi(100000))