当前位置: 首页 > ds >正文

inlier_outlier

inlier & outlier

在数据分析和机器学习中,inlier(内点)和 outlier(离群点)是用来描述数据分布中是否“符合主流规律”的术语,以下是详细解释:

✅ 一、Inlier(内点)

  • 定义:指那些符合数据整体趋势或模式的数据点。
  • 特点

与大部分数据处于相似范围或结构中。

在模型训练中通常被当作“正常数据”。

例如:在直线拟合中,靠近这条直线的数据点就是 inliers。

❌ 二、Outlier(离群点)

  • 定义:指那些明显偏离其他数据点的点,通常被认为是异常值或“噪声”。
  • 特点

与主流数据差异显著(如数值过大/过小、方向异常等)。

可能是数据错误、异常行为、设备故障、也可能是潜在的重要信号。

在模型拟合中常常会被忽略或单独处理(例如异常检测、鲁棒回归)。

在图像识别、金融欺诈检测、网络安全中尤为重要。

📌 举例说明

假设我们拟合一个二维平面上的直线模型:

  • 数据点大多聚集在直线附近 ⇒ 这些是 inliers
  • 某个点远离直线,偏差很大 ⇒ 是 outlier

💡 延伸:如何识别 Outliers?

常用方法包括:

  1. 统计方法
  • z-score(标准差距离)
  • IQR(四分位间距)
  1. 机器学习方法
  • Isolation Forest
  • One-Class SVM
  • DBSCAN(密度聚类算法)
  1. 鲁棒拟合模型
  • RANSAC(随机采样一致性算法):通过只使用 inliers 来拟合模型,同时识别并排除 outliers。
http://www.xdnf.cn/news/8062.html

相关文章:

  • 视觉大模型学习总结
  • 通过 curl 精准定位问题
  • 从零开始的嵌入式学习day25
  • Java SSM与SpringBoot面试题全面解析:从基础到源码
  • 线性表数据结构-队列
  • 8:点云处理—常见的四种3D相机
  • 今日行情明日机会——20250521
  • 探索Puter:一个基于Web的轻量级“云操作系统”
  • Java基础 5.21
  • 重磅升级!Google Play商店改版上线
  • Web服务器
  • C++语言的跨平台挑战和应对策略
  • centos7 p8p1使用ip addr查看时有的时候有两个ip,有的时候只有一个ip,有一个ip快,有一个ip慢
  • 如何在 Windows 10 或 11 上使用命令提示符安装 Angular
  • Vue Router动态路由与导航守卫实战
  • RESTful风格
  • 从零基础到最佳实践:Vue.js 系列(6/10):《Composition API(组合式 API)》
  • 论文篇目录-研究生如何阅读编写论文
  • Linux系统编程-DAY02
  • 直播美颜SDK技术解析:滤镜渲染与动态贴纸引擎融合的底层实现
  • 机器学习第二十讲:网格搜索 → 像尝试所有密码组合找最佳解锁方式
  • Python爬虫实战:获取天气网最近一周北京的天气数据,为日常出行做参考
  • java的synchronized 原理及功能
  • 继DeepSeek之后,又一国产模型迎来突破,或将解答手机端AI的疑惑
  • 教培机构线上线下课程小程序开发:构建数字化教育新生态
  • 模板初阶【C++】
  • 景区导览系统有哪些技术选型?架构设计到真实场景的攻坚指南(一)
  • docker面试题(4)
  • Parasoft为可口可乐赋能: 强化软件开发与质量保证
  • 二叉树的半线性