当前位置: 首页 > web >正文

Datawhale AI春训营 TASK2 学习笔记

概要

特征决定上限:有效的特征工程能显著提升模型性能

模型服务于数据:要根据数据特点选择合适模型

融合创造奇迹:加权平均可带来显著提升

从数据分析开始

plt.figure(figsize=(20,10))
for i in range(9):plt.subplot(3, 3, i+1)plt.plot(hours, train.iloc[:24, i])plt.title(train.columns[i])
plt.show()
  • 通过对数据的可视化可以发现:

  • GHI与POAI呈正相关

  • 风速分量U100/V100可合成总风速

  • 功率在凌晨时段达到峰值

  • target = target[target['时间'].str.endswith('00:00')]

    通过时间对齐来使功率数据降采样至小时级

构建有效的特征工程

特征工程指的是把原始数据转变为模型训练数据的过程,目的是获取更好的训练数据特征。

常见特征有 统计特征与时空特征

常用的处理方法有 过滤 包裹 嵌入

def feature_combine(df):df["wind_speed"] = np.sqrt(df['u100']**2 + df['v100']**2)  # 合成风速df["h"] = df.index % 24  # 时间周期性特征df["ghi/poai"] = df["ghi"] / (df["poai"] + 1e-7)  # 辐照效率比return df

模型的选取、训练与验证

如同人的能力各有千秋,选取不同的模型也会获得不同的效果,通过不断尝试来选取合适的模型

又如同智囊团,多个模型结果的再分析并输出可以获得更高的准确率

还可以采用交叉验证的策略

kf = KFold(n_splits=5, shuffle=True, random_state=2024)
for fold, (train_idx, valid_idx) in enumerate(kf.split(X)):

http://www.xdnf.cn/news/656.html

相关文章:

  • 简易Linux GPIO工具
  • vivo把三颗「主摄」放进了手机
  • 博客系统-RabbitMQ
  • 用键盘实现控制小球上下移动——java的事件控制
  • STM32单片机入门学习——第44节: [13-1] PWR电源控制
  • RAG框架精选2
  • Java优雅实现判空方法
  • 编码器---正交编码器
  • 【AI论文】对人工智能生成文本的稳健和细粒度检测
  • 【Rust 精进之路之第4篇-数据基石·上】标量类型:整数、浮点数、布尔与字符的精妙之处
  • 关于进程状态
  • QEMU源码全解析 —— 块设备虚拟化(20)
  • Linux——SSH
  • FTP客户端实现(文件传输)
  • AI提效思考 - 第一期
  • 区块链预言机(Oracle)详解:如何打通链上与现实世界的关键桥梁?
  • HeavyKeeper 算法
  • ESP32快速上手
  • 使用 Visual Studio 2022 中的 .http 文件
  • 基于SpringAI Alibaba实现RAG架构的深度解析与实践指南
  • 内容合作方资源哪里找?如何管理?
  • 【C语言】关于位置标识符
  • Kubernetes控制平面组件:API Server代码基础概念
  • 游戏引擎学习第238天:让 OpenGL 使用我们的屏幕坐标
  • 计算机视觉cv2入门之视频处理
  • 北理工宫某的瓜ppt下载地址
  • 算法篇之单调栈
  • 嵌入式学习——虚拟机通信
  • 堆排序的C++相关实现
  • Java编程基础(第四篇:字符串初次介绍)