当前位置: 首页 > news >正文

机器学习第六讲:向量/矩阵 → 数据表格的数学表达,如Excel表格转数字阵列

机器学习第六讲:向量/矩阵 → 数据表格的数学表达,如Excel表格转数字阵列

资料取自《零基础学机器学习》。
查看总目录:学习大纲

关于DeepSeek本地部署指南可以看下我之前写的文章:DeepSeek R1本地与线上满血版部署:超详细手把手指南


一、生活化比喻:数据世界的乐高积木 🧱

比喻场景1
假设学校图书馆有三种数据记录方式:

单本书信息
向量→书架单层(1行数据)
整排书架
矩阵→整个书库(多行多列)
温度记录表
列向量→周气温走势(单列测量值)

二、Excel表格转化演示 💻(教材第六章经典案例2

例:3月电子产品销售表

产品销量单价(元)
手机1202999
耳机85599
充电宝200129

转化为矩阵表示

Excel表格
数字阵列
矩阵内容:
[[120, 2999],
[85, 599],
[200, 129]]

数学表示
M = [ 120 2999 85 599 200 129 ] M = \begin{bmatrix} 120 & 2999 \\ 85 & 599 \\ 200 & 129 \\ \end{bmatrix} M= 120852002999599129


三、核心运算规则解析 ⚡️

  1. 加法运算:要求同维度矩阵
矩阵 A:
[[1,2],
[3,4]]
矩阵 A + 矩阵 B = 矩阵 C:
[[6,8],
[10,12]]
矩阵 B:
[[5,6],
[7,8]]
  1. 标量乘法:数乘每个元素
# 如数据整体涨价10%
价格矩阵 = [[2999],[599],[129]]
新价格 = 1.1 * 价格矩阵  # [[3298.9],[658.9],[141.9]]
  1. 矩阵乘法:行乘列的奇妙规则3
2x3
3x1
总收入矩阵:2x1
产品矩阵
计算
价格矩阵
结果
展示

四、数据科学中的现实价值 📊

数据形态向量/矩阵形式应用场景
学生成绩单行向量班级平均分计算
医院化验报告列向量健康指标趋势分析
电商用户画像用户×商品矩阵推荐系统构建
城市交通流量时间×路口流量矩阵智能信号灯控制

五、图像处理的魔法揭秘 🖼️

原理
每个图片本质上都是像素值矩阵,例如:

原图
红蓝绿三通道矩阵
红色矩阵(数值0-255)
绿色矩阵
蓝色矩阵

代码示例(教材第六章代码片段4):

import numpy as np
# 创建100x100像素的红色方块矩阵 
red_block = np.ones((100,100)) * 255
green_block = np.zeros((100,100))
blue_block = np.zeros((100,100))

六、易犯错误警示牌 🚨(注意事项5

  1. 尺寸错误:试图相加3×2和2×3矩阵
3x2 + 2x3
错误加法
程序报错
  1. 空值污染:Excel中的N/A未处理直接运算
原始数据:[120, null, 200]
错误计算:sum = 120 + null + 200 → NaN
  1. 内存爆炸:处理100万×100万维度的超大型矩阵时需要先做数据分块

七、核心要义总结 💎

向量与矩阵是用数学语言精确描述多维数据的基础工具,如同建筑的砖瓦构成数据科学大厦(教材第六章核心结论1

(典型案例:Netflix用户-影片评分矩阵是推荐算法的关键输入数据🎬)

目录:总目录
上篇文章:机器学习第五讲:强化学习 → 电子宠物狗试错学习,做对给虚拟奖励
下篇文章:机器学习第七讲:概率统计 → 预测可能性,下雨概率70%就是典型应用



  1. 《零基础学机器学习》第六章第一节"数据矩阵表达",P.265 ↩︎ ↩︎

  2. 《零基础学机器学习》第六章案例6-2"零售数据转化",P.278-280 ↩︎

  3. 《零基础学机器学习》第六章运算规则推导,P.289-293 ↩︎

  4. 《零基础学机器学习》第六章代码附录,P.317 ↩︎

  5. 《零基础学机器学习》第六章注意事项,P.308 ↩︎

http://www.xdnf.cn/news/399475.html

相关文章:

  • HDFS客户端操作
  • 堆复习(C语言版)
  • 首屏优化,webpack插件用于给html中js自动添加异步加载属性
  • Linux操作系统从入门到实战(六)Linux开发工具(上)详细介绍什么是软件包管理器,Linux下如何进行软件和软件包的安装、升级与卸载
  • 探索边缘计算:赋能物联网的未来
  • 一.Gitee基本操作
  • 2025年阿里云ACP人工智能高级工程师认证模拟试题(附答案解析)
  • Vue:插值表达
  • 如何在 Bash 中使用 =~ 操作符 ?
  • 单词短语0512
  • C++色彩博弈的史诗:红黑树
  • 关于大语言模型的困惑度(PPL)指标优势与劣势
  • 菊厂0510面试手撕题目解答
  • spdlog日志格式化 标志全指南
  • Java详解LeetCode 热题 100(14):LeetCode 56. 合并区间(Merge Intervals)详解
  • 【网络安全】SQL注入
  • pdf 不是扫描件,但却无法搜索关键词【问题尝试解决未果记录】
  • 用短说社区搭建的沉浸式生活方式分享平台
  • Redis+Caffeine构建高性能二级缓存
  • Python邮件处理(使用imaplib和email库实现自动化邮件处理)
  • Kubernetes控制平面组件:Kubelet详解(一):API接口层介绍
  • 自主添加删除开机启动项
  • tinyint(3)数据类型讲解
  • stm32之BKP备份寄存器和RTC时钟
  • 基于Python的高效批量处理Splunk Session ID并写入MySQL的解决方案
  • Hadoop 的代理用户(Proxy User)​ 功能解释
  • 配置hosts
  • 推理加速新范式:火山引擎高性能分布式 KVCache (EIC)核心技术解读
  • 深入理解Embedding Models(嵌入模型):从原理到实战(下)
  • 【机器人】复现 UniGoal 具身导航 | 通用零样本目标导航 CVPR 2025