0前言(文章体系)
1. 课程与基础概念
- 1.1 课程简介
2. 函数与数学分析基础
- 1.2 函数
- 1.3 极限
- 1.4 无穷小与无穷大
- 1.5 连续性与导数
- 1.6 偏导数
- 1.7 方向导数
- 1.8 梯度
3. 微积分基础
- 2.1 微积分基本想法
- 2.2 微积分的解释
- 2.3 定积分
- 2.4 定积分性质
- 2.5 牛顿-莱布尼茨公式
4. 泰勒展开与优化方法
- 3.1 泰勒公式出发点
- 3.2 一点一世界
- 3.3 阶数的作用
- 3.4 阶乘的作用
- 3.5 拉格朗日乘子法
- 3.6 求解拉格朗日乘子法
5. 线性代数基础
- 4.1 行列式概述
- 4.2 矩阵与数据的关系
- 4.3 矩阵基本操作
- 4.4 矩阵的几种变换
- 4.5 矩阵的秩
- 4.6 内积与正交
6. 特征值、特征向量与矩阵分解
- 5.1 特征值与特征向量
- 5.2 特征空间与应用
- 5.3 SVD要解决的问题
- 5.4 特征值分解
- 5.5 SVD矩阵分解
7. 概率论基础
- 6.1 离散型随机变量
- 6.2 连续型随机变量
- 6.3 简单随机抽样
- 6.4 似然函数
- 6.5 极大似然估计
- 7.1 概率与频率
- 7.2 古典概型
- 7.3 条件概率
- 7.4 条件概率小例子
- 7.5 独立性
- 7.6 二维离散型随机变量
- 7.7 二维连续型随机变量
- 7.8 边缘分布
- 7.9 期望
- 7.10 期望求解
- 7.11 马尔科夫不等式
- 7.12 切比雪夫不等式
- 7.13 后验概率估计
8. 常见概率分布
- 8.1 正态分布
- 8.2 二项式分布
- 8.3 泊松分布
- 8.4 均匀分布
- 8.5 卡方分布
- 8.6 Beta分布
9. 核方法与核函数
- 9.1 核函数的目的
- 9.2 线性核函数
- 9.3 多项式核函数
- 9.4 核函数实例
- 9.5 高斯核函数
- 9.6 参数的影响
10. 信息论与激活函数
- 10.1 熵的概念
- 10.2 熵的大小意味着什么
- 10.3 激活函数
- 10.4 激活函数的问题
11. 回归分析
- 11.1 回归分析概述
- 11.2 回归方程定义
- 11.3 误差项的定义
- 11.4 最小二乘法推导与求解
- 11.5 回归方程求解小例子
- 11.6 回归直线拟合优度
- 11.7 多元与曲线回归问题
- 11.8 Python工具包介绍
- 11.9 statsmodels回归分析
- 11.10 高阶与分类变量实例
- 11.11 案例:汽车价格预测任务概述
- 11.12 案例:缺失值填充
- 11.13 案例:特征相关性
- 11.14 案例:预处理问题
- 11.15 案例:回归求解
12. 假设检验
- 12.1 假设检验基本思想
- 12.2 左右侧检验与双侧检验
- 12.3 Z检验基本原理
- 12.4 Z检验实例
- 12.5 T检验基本原理
- 12.6 T检验实例
- 12.7 T检验应用条件
- 12.8 卡方检验
- 12.9 假设检验中的两类错误
- 12.10 Python假设检验实例
- 12.11 Python卡方检验实例
13. 相关分析
- 13.1 相关分析概述
- 13.2 皮尔森相关系数
- 13.3 计算与检验
- 13.4 斯皮尔曼等级相关
- 13.5 肯德尔系数
- 13.6 质量相关分析
- 13.7 偏相关与复相关
14. 方差分析(ANOVA)
- 14.1 方差分析概述
- 14.2 方差的比较
- 14.3 方差分析计算方法
- 14.4 方差分析中的多重比较
- 14.5 多因素方差分析
- 14.6 Python方差分析实例
15. 聚类分析
- 15.1 层次聚类概述
- 15.2 层次聚类流程
- 15.3 层次聚类实例
- 15.4 KMEANS算法概述
- 15.5 KMEANS工作流程
- 15.6 KMEANS迭代可视化展示
- 15.7 DBSCAN聚类算法
- 15.8 DBSCAN工作流程
- 15.9 DBSCAN可视化展示
- 15.10 多种聚类算法概述
- 15.11 聚类案例实战
16. 贝叶斯统计
- 16.1 贝叶斯分析概述
- 16.2 概率的解释
- 16.3 贝叶斯学派与经典统计学派的争论
- 16.4 贝叶斯算法概述
- 16.5 贝叶斯推导实例
- 16.6 贝叶斯拼写纠错实例
- 16.7 垃圾邮件过滤实例
- 16.8 贝叶斯解释
- 16.9 经典求解思路
- 16.10 MCMC概述
- 16.11 PYMC3概述
- 16.12 模型诊断
- 16.13 模型决策
简单解释
知识树根系:数学三原色(模块1-6)
- 函数与极限(模块2)→ 观察世界的显微镜
• 为什么学:世间万物都在变化(股票价格、气温波动),函数就是描述变化的语言
• 关键突破:当变化无限小时(1.3极限),瞬时速度(1.5导数)概念诞生 → 后来演变成梯度(1.8)
• 暗线:导数本质是函数空间的线性逼近(为泰勒展开埋下伏笔)
- 微积分(模块3)→ 计算变化的工具箱
• 核心发现:微分与积分互为逆运算(2.5牛顿公式)→ 如同拼图的正反两面
• 工程价值:求曲线下面积(2.3定积分)看似抽象,实则是计算概率(模块7)的基础
- 线性代数(模块5-6)→ 高维空间的导航仪
• 矩阵革命:把方程组运算(4.3矩阵操作)抽象为空间变换
• 降维打击:特征值分解(5.4)就像找到数据的主轴方向 → 后来发展为PCA降维
交汇点:泰勒展开(模块4)是数学思维的转折点
• 用多项式函数(1.2)逼近复杂函数 → 开启用简单工具解决复杂问题的先河
• 拉格朗日乘子法(3.5)本质是在约束条件下找最优路径 → 现代优化的鼻祖
知识树主干:概率与信息(模块7-10)
- 概率论(模块7-8)→ 不确定性的度量衡
• 认知革命:从确定性的"必然"(古典概型7.2)到不确定的"可能"(条件概率7.3)
• 核心武器:正态分布(8.1)如同概率世界的引力定律 → 支撑后续所有统计检验
- 信息论(模块10)→ 知识的量化标准
• 熵(10.1)的哲学:混乱度的度量 → 后来成为决策树(机器学习)的核心指标
• 激活函数(10.3):将概率转化为神经元开关 → 神经网络的启蒙思想
关键转折:核方法(模块9)突破维度诅咒
• 线性不可分?用核函数把数据"炸"到高维空间(9.5高斯核)→ 支持向量机的理论基础
知识树枝干:数据分析四剑客(模块11-14)
- 回归分析(模块11)→ 因果关系的探测器
• 最小二乘法(11.4)实质是寻找最优拟合平面 → 线性代数(4.3)的工程实现
• 案例实战(11.11-15)演示数据清洗到预测的全流程 → 真实世界的数学建模
- 假设检验(模块12)→ 统计推断的法庭
• Z/T检验(12.3-6)如同概率世界的"无罪推定"
• 两类错误(12.9)揭示统计学家的风险管控思维
- 方差分析(14)→ 多组比较的放大镜
• 方差分解思想直接继承矩阵秩(4.5)的概念 → 用线性代数破解生物实验难题
知识树果实:智能算法(模块15-16)
- 聚类分析(15)→ 无监督学习的探路者
• KMEANS(15.4)本质是梯度下降(1.8)的循环逼近 → 数学优化思想的延伸
• DBSCAN(15.7)用概率密度(8.4)定义族群 → 概率论与几何的结合
- 贝叶斯统计(16)→ 动态更新的认知系统
• 贝叶斯定理(16.5)实现"用新证据更新信念" → 垃圾邮件过滤(16.7)的数学内核
• MCMC(16.10)如同高维空间的智能探针 → 突破积分计算难题
终极白话说人话版:
整个知识体系就像在训练「用数学语言翻译现实世界」的能力:
-
基础语法:函数是动词(描述变化),矩阵是介词(连接变量),概率是情态动词(表达可能性)
-
核心技能:
• 看见看不见的:用导数看趋势,用积分看总量,用概率看可能性• 处理复杂的:用矩阵分解高维数据,用核函数突破线性限制
• 预测未知的:用回归找规律,用贝叶斯更新认知
-
终极目标:培养「遇到问题→数学建模→算法解决→现实验证」的闭环思维
举个实际例子:预测房价(模块11案例)
• 用函数(1.2)描述房价随时间变化 → 用导数(1.5)找最佳投资时点 → 用矩阵(4.3)处理多因素(面积、学区等) → 用回归(11.4)建立预测模型 → 用假设检验(12.3)验证因素显著性 → 最终用聚类(15)划分客户群体