当前位置: 首页 > ds >正文

Python训练营-Day29-复习日

对之前的内容做一个梳理,围绕机器学习全流程展开,从数据预处理 → 特征工程 → 模型训练 → 评估优化,形成完整闭环。

将之前做过的关键步骤记录下来:

# ==== 编程基础 ====
# DAY1: 变量与格式化字符串
name = "Alice"
print(f"Hello, {name}!")# DAY3: 列表、循环和判断
nums = [1, 2, 3]
for num in nums:if num > 1: print(num)# ==== 数据处理 ====
# DAY4: 缺失值处理 (Pandas)
import pandas as pd
df = pd.DataFrame({'A': [1, None, 3]})
df.fillna(df.mean(), inplace=True)# DAY5: 独热编码
from sklearn.preprocessing import OneHotEncoder
encoder = OneHotEncoder().fit(df[['category']])# DAY8: 标签编码
from sklearn.preprocessing import LabelEncoder
LabelEncoder().fit_transform(['A', 'B', 'A'])# ==== 可视化 ====
# DAY9: 热力图 (Seaborn)
import seaborn as sns
sns.heatmap(df.corr(), annot=True)# ==== 机器学习 ====
# DAY10: 建模与评估 (Scikit-learn)
from sklearn.ensemble import RandomForestClassifier
model = RandomForestClassifier().fit(X_train, y_train)
print(model.score(X_test, y_test))# DAY11: 调参 (GridSearchCV)
from sklearn.model_selection import GridSearchCV
param_grid = {'n_estimators': [50, 100]}
GridSearchCV(model, param_grid, cv=5).fit(X, y)# DAY14: SHAP分析
import shap
shap_values = shap.TreeExplainer(model).shap_values(X)# ==== 特征工程 ====
# DAY19: 特征筛选 (Lasso)
from sklearn.linear_model import Lasso
Lasso(alpha=0.1).fit(X, y).coef_# DAY20: SVD分解
from sklearn.decomposition import TruncatedSVD
TruncatedSVD(n_components=2).fit_transform(X)# ==== 高级语法 ====
# DAY25: 异常处理
try: x = 1/0
except ZeroDivisionError: print("Error")# DAY27: 装饰器
def my_decorator(func):def wrapper(): print("Before"); func()return wrapper# DAY28: 类定义
class MyClass:def __init__(self, x): self.x = xdef print_x(self): print(self.x)

@浙大疏锦行

http://www.xdnf.cn/news/13853.html

相关文章:

  • 修改FFMpeg的日志函数av_log,使其在记录日志时能显示调用该函数的位置(文件名和行号)
  • Metastore 架构示意图和常用 SQL
  • 前端加密当日
  • 力扣前缀和
  • 河南农担携手Gitee企业版:构建农业金融数字化研发新基建
  • 网络层协议:IP
  • qt初识--02
  • 移动电储能工作原理及SOC约束解析
  • 光谱相机叶绿素荧光成像技术的原理
  • Vue 组件通信
  • Jenkins 配置信息导出 的详细说明(中英对照)
  • 如何用AI赋能学习
  • OpenCV CUDA模块图像变形------对图像进行 尺寸缩放(Resize)操作函数resize()
  • Elasticsearch:使用 ES|QL 进行地理空间距离搜索
  • Linux612 chroot_list开放;FTP服务ftp:get put,指定上传路径报错553;ftp查看文件夹权限
  • 28-Oracle 23ai Fast Ingest(Memoptimized Rowstore)高频写入
  • 西电【信息与内容安全】课程期末复习笔记
  • jupyter notebook的相关知识及可能遇到的问题
  • LeetCode 2917.找出数组中的K-or值
  • Shell 脚本:系统管理与任务自动化的利器
  • docker compose安装Prometheus、Grafana
  • ubuntu网络连接失败 + mobaxterm拖拽文件出错等问题解决方法
  • CQL3D编译指南
  • PPIO 上线 Qwen3-Embedding 系列模型
  • C++学习-入门到精通【19】杂项汇总
  • 企业级人员评价系统Web端重构实战:前端架构效能升级
  • 【11408学习记录】考研数学核心突破:矩阵本质、系统信息与向量空间基
  • Linux系统lvm操作演示
  • 傲火集团传媒基地武汉启幕 构建数字娱乐产业生态闭环
  • 图像处理 | 基于matlab的多尺度Retinex(MSR)和自适应直方图均衡化(CLAHE)算法联合的低照度图像增强(附代码)