当前位置：首页 > news >正文

量化交易之数学与统计学基础2.4——线性代数与矩阵运算 | 矩阵分解

news 2025/7/3 22:56:06

量化交易之数学与统计学基础2.4——线性代数与矩阵运算 | 矩阵分解

在这里插入图片描述

第二部分：线性代数与矩阵运算
第4节：矩阵分解：奇异值分解（SVD）在数据压缩和风险分解的应用

一、奇异值分解（SVD）基础：矩阵的“积木分解”

奇异值分解是一种强大的矩阵分解方法，它可以将任意矩阵分解为三个矩阵的乘积，为数据处理和分析提供了有力的工具。

1. 数学定义

对于一个 $m\times n$ 的矩阵 $\mathbf{A}$ ，其奇异值分解可以表示为：
$\mathbf{A}=\mathbf{U}\mathbf{\Sigma}\mathbf{V}^T$
其中， $\mathbf{U}$ 是 $m\times m$ 的正交矩阵（ $\mathbf{U}^T\mathbf{U}=\mathbf{I}_m$ ），其列向量称为左奇异向量； $\mathbf{\Sigma}$ 是 $m\times n$ 的对角矩阵，对角线上的元素 $\sigma_1\geq\sigma_2\geq\cdots\geq\sigma_r>0$ 称为奇异值， $\text{rank}(\mathbf{A})$ ； $\mathbf{V}$ 是 $n\times n$ 的正交矩阵（ $\mathbf{V}^T\mathbf{V}=\mathbf{I}_n$ ），其列向量称为右奇异向量。

2. 求解方法

通常可以通过计算 $\mathbf{A}^T\mathbf{A}$ 的特征值和特征向量来得到 $\mathbf{V}$ 和 $\mathbf{\Sigma}$ ，然后通过 $\mathbf{A}\mathbf{V}=\mathbf{U}\mathbf{\Sigma}$ 计算 $\mathbf{U}$ 。在实际应用中，可以使用数值计算库（如 NumPy）来高效地完成 SVD 分解。

二、数据压缩：用 SVD 减少数据存储与计算成本

在量化交易中，我们经常需要处理大规模的数据矩阵，如历史价格数据、因子暴露矩阵等。SVD 可以帮助我们对这些数据进行压缩，减少存储和计算成本。

1. 低秩近似

矩阵 $\mathbf{A}$ 的 SVD 分解中，奇异值 $\sigma_i$ 反映了矩阵的重要信息。通常，大部分重要信息集中在前面几个较大的奇异值上。因此，我们可以只保留前 $k$ 个奇异值（ $k < r$ ），得到矩阵 $\mathbf{A}$ 的低秩近似：
$\mathbf{A}_k=\mathbf{U}_k\mathbf{\Sigma}_k\mathbf{V}_k^T$
其中， $\mathbf{U}_k$ 是 $\mathbf{U}$ 的前 $k$ 列， $\mathbf{\Sigma}_k$ 是 $\mathbf{\Sigma}$ 的前 $k$ 个奇异值构成的 $k\times k$ 对角矩阵， $\mathbf{V}_k$ 是 $\mathbf{V}$ 的前 $k$ 列。

2. 量化应用

历史数据存储：对于历史价格数据矩阵，通过 SVD 压缩可以减少存储空间，同时保留大部分重要信息。
因子数据处理：在多因子模型中，对因子暴露矩阵进行 SVD 压缩，可以减少因子数量，提高计算效率。

三、风险分解：用 SVD 剖析投资组合的风险来源

在投资组合管理中，了解投资组合的风险来源至关重要。SVD 可以帮助我们将投资组合的风险分解为不同的风险因子。

1. 风险矩阵分解

假设投资组合的协方差矩阵为 $\mathbf{\Sigma}$ ，对其进行 SVD 分解：
$\mathbf{\Sigma}=\mathbf{U}\mathbf{\Lambda}\mathbf{U}^T$
其中， $\mathbf{\Lambda}$ 是对角矩阵，对角线上的元素是 $\mathbf{\Sigma}$ 的特征值， $\mathbf{U}$ 是特征向量矩阵。每个特征值对应一个风险因子，特征向量表示投资组合在该风险因子上的暴露。

2. 风险贡献分析

通过 SVD 分解，我们可以计算每个风险因子对投资组合总风险的贡献。例如，第 $i$ 个风险因子的风险贡献可以表示为：
$RC_i = w^T\mathbf{U}_i\lambda_i\mathbf{U}_i^Tw$
其中， $w$ 是投资组合的权重向量， $\mathbf{U}_i$ 是第 $i$ 个特征向量， $\lambda_i$ 是第 $i$ 个特征值。

四、投资组合优化：用 SVD 寻找最优投资组合

投资组合优化的目标是在给定的风险水平下最大化投资组合的收益，或者在给定的收益水平下最小化投资组合的风险。SVD 可以帮助我们在优化过程中处理高维的协方差矩阵。

1. 优化问题

经典的马科维茨投资组合优化问题可以表示为：
$\min_{w} w^T\mathbf{\Sigma}w\quad\text{s.t.}\quad w^T\mathbf{\mu}=r_p,\quad w^T\mathbf{1}=1$
其中， $w$ 是投资组合的权重向量， $\mathbf{\Sigma}$ 是协方差矩阵， $\mathbf{\mu}$ 是预期收益率向量， $r_p$ 是目标收益率。

2. SVD 辅助优化

通过对协方差矩阵 $\mathbf{\Sigma}$ 进行 SVD 分解，可以将优化问题转化为低维空间中的问题，减少计算复杂度。同时，SVD 可以帮助我们处理协方差矩阵的病态问题，提高优化结果的稳定性。

五、Python 实践：用 SVD 进行数据压缩和风险分解

import numpy as np
import matplotlib.pyplot as plt# 生成模拟数据矩阵（100 行，20 列）
np.random.seed(42)
A = np.random.randn(100, 20)# 1. SVD 分解
U, Sigma, Vt = np.linalg.svd(A)# 2. 数据压缩：保留前 5 个奇异值
k = 5
U_k = U[:, :k]
Sigma_k = np.diag(Sigma[:k])
Vt_k = Vt[:k, :]
A_k = U_k @ Sigma_k @ Vt_k# 3. 可视化原始矩阵和压缩后的矩阵
plt.figure(figsize=(12, 5))
plt.subplot(1, 2, 1)
plt.imshow(A, cmap='hot', interpolation='nearest')
plt.title('原始矩阵')
plt.subplot(1, 2, 2)
plt.imshow(A_k, cmap='hot', interpolation='nearest')
plt.title(f'压缩后的矩阵（保留 {k} 个奇异值）')
plt.show()# 4. 风险分解：假设 A 是协方差矩阵
eigenvalues = Sigma**2
total_risk = np.sum(eigenvalues)
risk_contributions = eigenvalues / total_risk# 可视化风险贡献
plt.figure(figsize=(8, 5))
plt.bar(np.arange(len(risk_contributions)), risk_contributions)
plt.xlabel('风险因子')
plt.ylabel('风险贡献')
plt.title('风险因子的风险贡献')
plt.show()