当前位置: 首页 > news >正文

MATLAB的cvpartition函数用法


1. 函数作用

cvpartition 将数据集划分为训练集和测试集,支持多种交叉验证方法,包括:

  • Hold-Out验证:单次划分(如70%训练,30%测试)
  • K折交叉验证:数据分为K个子集,依次用其中一个作为测试集
  • 留一法(Leave-One-Out):每次留一个样本作为测试集
  • 分层交叉验证:保持不同类别的样本比例一致

2. 基本语法

c = cvpartition(n, 'Method', value, ...)
c = cvpartition(group, 'Method', value, ...)  % 分层选项

3. 参数说明

参数说明
n样本数量
group类别标签向量(用于分层交叉验证)
'Method'验证方法:'HoldOut', 'KFold', 'LeaveOut'
'HoldOut'参数测试集比例 p(默认0.1)
'KFold'参数折数 k(默认10)

4. 常用方法示例

Hold-Out 验证
data = rand(100, 5); % 100个样本,5个特征
c = cvpartition(100, 'HoldOut', 0.3); % 30%作为测试集trainIdx = training(c); % 逻辑索引(训练集)
testIdx = test(c);      % 逻辑索引(测试集)trainData = data(trainIdx, :);
testData = data(testIdx, :);
K折交叉验证(5折)
c = cvpartition(100, 'KFold', 5);
for i = 1:c.NumTestSetstrainIdx = training(c, i); % 第i折的训练索引testIdx = test(c, i);      % 第i折的测试索引% 在此训练和验证模型
end
分层K折交叉验证
labels = [ones(50,1); zeros(50,1)]; % 类别标签(二分类)
c = cvpartition(labels, 'KFold', 5); % 保持各类比例% 查看每折的类别分布
disp(c.TestSize); % 每折测试集样本数
留一法(LOO)
c = cvpartition(100, 'LeaveOut');
for i = 1:c.NumTestSetstrainIdx = training(c, i);testIdx = test(c, i); % 每次仅1个测试样本
end

5. 对象属性与方法

  • 属性
    • c.NumTestSets:测试集数量(K折时为K)
    • c.TrainSize:各训练集大小
    • c.TestSize:各测试集大小
  • 方法
    • training(c, i):获取第i折的训练索引
    • test(c, i):获取第i折的测试索引
    • repartition(c):重新随机化分区(仅Hold-Out和KFold)

6. 注意事项

  • 随机种子:使用 rng(seed) 确保结果可重复。
  • 分层必要性:分类问题建议使用分层选项,避免类别分布不均。
  • 大数据慎用LOO:留一法计算成本高,样本量大时改用K折。

http://www.xdnf.cn/news/316225.html

相关文章:

  • AI辅助DevOps与自动化测试:重构软件工程效率边界
  • stm32之ADC
  • 什么是智能合约?区块链上的自动化契约
  • 文章记单词 | 第67篇(六级)
  • ​​大疆无人机SDR 链路​​
  • 28. C++位图 布隆过滤器 哈希切割相关
  • PostgreSQL 系统管理函数详解
  • Rest架构解说
  • idea里maven自定义的setting.xml文件不生效问题
  • 基于DR模式的LVS集群案例
  • AI检测的荒谬性:当规则沦为一场概率游戏
  • LLaMA-Omni 2:基于 LLM 的自回归流语音合成实时口语聊天机器人
  • 单片机-STM32部分:6、不同编程方式-寄存器、标准库、HAL库、LL库
  • 中间件-RocketMQ
  • k8s | Kubernetes 服务暴露:NodePort、Ingress 与 YAML 配置详解
  • 【代码优化篇】强缓存和协商缓存
  • ABP-Book Store Application中文讲解 - 前期准备 - Part 2:创建Acme.BookStore + Angular
  • 【ArcGIS Pro微课1000例】0068:Pro原来可以制作演示文稿(PPT)
  • 理解与清理 Docker 中的悬空镜像(Dangling Images)
  • 8.12 GitHub Sentinel企业级进化:容器化优化×AI监控,效率提升300%实战
  • HarmonyOS运动开发:如何集成百度地图SDK、运动跟随与运动公里数记录
  • 实践004-Gitlab CICD部署应用
  • 小刚说C语言刷题—1331 做彩纸花边
  • 五、Hadoop集群部署:从零搭建三节点Hadoop环境(保姆级教程)
  • Spark和Hadoop之间的联系
  • JDK Version Manager (JVMS)
  • 【论文阅读】在调制分类中针对对抗性攻击的混合训练时和运行时防御
  • Web 架构之动静分离:原理、实践与优化
  • WHAT - Rust 智能指针
  • 【PostgreSQL】数据库主从库备份与高可用部署