当前位置: 首页 > news >正文

机器学习 Day1

机器学习概述

  • 机器学习与人工智能、深度学习关系
  • 什么是机器学习
  • 数据集
  • 算法

机器学习与人工智能、深度学习关系

在这里插入图片描述

什么是机器学习

机器学习是从数据中自动分析获取模型,并利用模型对未知数据进行预测。

直观理解:
在这里插入图片描述

所以是从历史数据中获取规律,那么这些历史数据是怎么构成的呢?

数据集

结构:特征值+目标值

正式定义:
特征值与目标值
特征值(Features):
描述数据的属性(通常是多列),用X表示。
例如:房价预测中的面积、地段、房龄。

目标值(Target):
模型要预测的结果(通常是单列),用y表示。
例如:最终的房价。

case:用“相亲”比喻机器学习
假设你是一个相亲网站的AI,任务是预测两个人是否适合结婚。你需要收集数据并让模型学习规律:

特征值(Features):

就是模型的“输入线索”,比如:
年龄、身高、收入、兴趣爱好、学历

相当于你作为媒人时,会问对方的“条件”。

目标值(Target):

是模型要“猜”的结果,比如:
是否成功结婚(是/否)

相当于你最终看到的“相亲结果”。

算法

一、监督学习(Supervised Learning)
核心思想:像老师教学生,给算法“标准答案”(即目标值y)去学习规律。

  1. 典型案例:
    分类问题 → 预测类别
    例:垃圾邮件识别(是/否)、癌症诊断(恶性/良性)

回归问题 → 预测数值
例:房价预测、股票价格

  1. 常用算法:
    算法名称 比喻 适用场景
    线性回归 用尺子画最拟合的直线 房价趋势预测
    决策树 连环问答式判断 贷款审批
    随机森林 多个专家投票决策 电商用户流失预警
    SVM(支持向量机) 找最大间隔的分界线 图像分类
  2. 关键特点:
    必须有已标注的数据(即既有X也有y)

模型训练后可以预测新数据的y值

二、无监督学习(Unsupervised Learning)
核心思想:像让孩子自己整理玩具,没有标准答案,算法自行发现数据中的模式。

  1. 典型案例:
  • 聚类(Clustering) → 自动分组
    例:用户分群、新闻话题归类

  • 降维(Dimensionality Reduction) → 压缩数据
    例:3D数据可视化展示到2D

  1. 常用算法:
    算法名称 比喻 适用场景
    K-Means 按距离划分小组 市场客户细分
    PCA 提取最关键特征 人脸识别预处理
    Apriori 找频繁出现的组合 超市商品关联推荐
  2. 关键特点:
    只有特征值X,没有目标值y

结果通常需要人工解读意义

三、强化学习(Reinforcement Learning)
核心思想:像训练小狗,通过“奖励/惩罚”让算法自己摸索最佳策略。

  1. 典型案例:
    游戏AI(如AlphaGo)

自动驾驶决策

机器人控制

  1. 核心概念:
    Agent(智能体):学习的AI

Environment(环境):交互的世界

Reward(奖励):行为的反馈信号

四、算法选择流程图
在这里插入图片描述

http://www.xdnf.cn/news/616861.html

相关文章:

  • 【python】局域网内通过python远程重启另一台windows电脑
  • Ntfs!ReadIndexBuffer函数调用Ntfs!NtfsMapStream函数的参数FileOffset为什么是0
  • PPP 流程已经走到启动阶段并且成功进入了 “STAGE_START_PPP
  • Linux PXE批量装机+无人值守技术(自动化装机)
  • [特殊字符] GUNION SDK 接口调用方式说明(静态库 vs 动态库)
  • 树莓派的刷机和登录
  • 常见证书格式区别
  • 矩阵详解:线性代数在AI大模型中的核心支柱
  • win11 24H2 版本,运行.vbs错误:没有文件扩展“.vbs“的脚本引擎
  • 夺命充电何时休?电瓶车入室起火事件频发
  • Linux C/C++编程 —— 线程技术总结
  • 家政维修平台实战09:推送数据到多维表格
  • 得力DE-620K针式打印机打印速度不能调节维修一例
  • AI Engine Kernel and Graph Programming--知识分享6
  • 深度探讨:AI 的全能边界 —— 哪些任务仍超越当前技术范畴?
  • 高校外卖小程序,怎么落地实践?
  • echarts之折线柱状图
  • 【ISP算法精粹】ISP算法管线的预处理算法有哪些?
  • Linux之 SPI 驱动框架- spi-mem 框架
  • 虚拟化工具libvirt日志文件的结构化使用指南
  • Python 脚本执行命令的深度探索:方法、示例与最佳实践
  • 蓝桥杯2025.5.23每日一题-儿童数
  • 中科驭数携DPU全栈产品亮相福州数博会,赋能智算时代算力基建
  • Trae 的核心功能介绍
  • OS面试篇
  • BU9792驱动段式LCD
  • C++:无序容器
  • 第十四届蓝桥杯国赛PythonA题解
  • Ubuntu系统下,使用system函数运行终端指令,如何避免输入密码的方法
  • 大数据任务调度实战:DolphinScheduler 与 Airflow 深度解析与最佳实践