当前位置：首页 > ops >正文

第五课：大白话教你用K邻近算法做分类和回归

ops 2025/6/25 14:58:06

K近邻算法：你的「最像前任」预测器

大家好！这节课我要介绍一个超有意思的算法——K近邻（K-Nearest Neighbors，简称KNN）。它可能是机器学习界最「懒」的算法，但偏偏在很多问题上表现惊人！我会用最接地气的方式，带你理解它的工作原理、为什么它这么「懒」、以及它如何帮你做分类和预测。保证你看完不仅能懂，还能用这个知识在朋友聚会上装X！
在这里插入图片描述

1. KNN是什么？——「物以类聚」的科学版

1.1 一句话定义

KNN的核心思想就一句话：「看看你周围的小伙伴都是谁，你就大概率是谁」。

1.2 现实生活类比

想象你在大学开学第一天：

你不知道该加入哪个社团（分类问题）
于是你观察周围最接近的5个同学（K=5）
- 如果3个是动漫社的，2个是篮球社的 → 你大概率是动漫社的
- 这就是KNN分类！

如果是预测你的期末成绩（回归问题）：

找出上学期和你学习习惯最像的5个学长
把他们的平均成绩作为你的预测成绩
- 这就是KNN回归！

2. 算法原理：三步搞定KNN

KNN的工作流程简单到令人发指，就像选美比赛：

Step 1：收集所有参赛者（训练阶段）

把已知数据（比如100个已分类的同学）放在一个「人才库」里
关键点：KNN这时什么都不学！只是把数据存起来（所以叫「惰性学习」）

Step 2：来了个新人（预测阶段）

来了个新同学小明，要判断他该加入哪个社团
计算小明和人才库里每个人的「相似度」（通常是欧氏距离）

Step 3：找最像的K个邻居投票

假设K=5，找出和小明最相似的5个同学
看这5人中哪个社团最多，就分配给小明

![外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传](https://img-home.csdnimg.cn/images/20230724024159.png?origin_url=https%3A%2F%2Fmiro.medium.com%2Fmax%2F1200%2F1*Q3z5qSrFWPxFVKqGcm4JGw.gif&pos_id=img-XWoP5378-1750750848906