基于支持向量机(SVM)的P300检测分类
基于支持向量机(SVM)的P300检测分类MATLAB实现,包含数据预处理、特征提取和分类评估流程:
%% P300检测分类完整流程(SVM实现)
clc; clear; close all;%% 1. 数据加载与模拟生成(实际应用需替换为真实数据)
% 生成模拟EEG数据(实际应加载真实数据)
[sampleRate, numChannels, numTrials, trialLength] = deal(250, 32, 200, 500); % 参数设置
data = randn(numChannels, trialLength, numTrials); % 模拟EEG数据
labels = randi([0 1], 1, numTrials); % 0=非目标,1=目标刺激%% 2. 数据预处理
% 2.1 滤波处理(带通滤波0.1-30Hz)
[b,a] = butter(4, [0.1 30]/(sampleRate/2)); % 4阶巴特沃斯滤波器
filteredData = zeros(size(data));
for i = 1:numChannelsfilteredData(i,:,:) = filtfilt(b,a,squeeze(data(i,:,:)));
end% 2.2 分段处理(基于事件时间窗口)
windowStart = 300; % 刺激后300ms开始
windowEnd = 600; % 窗口长度300ms
timePoints = windowStart:windowEnd;
preprocessedData = zeros(numChannels, numel(timePoints), numTrials);for trial = 1:numTrials% 找到对应时间窗口的样本索引startIdx = round((windowStart/sampleRate)*sampleRate) + 1;endIdx = round((windowEnd/sampleRate)*sampleRate);preprocessedData(:,:,trial) = filteredData(:,startIdx:endIdx);
end%% 3. 特征提取
% 3.1 时域特征提取
features = [];
for trial = 1:numTrialstrialData = squeeze(preprocessedData(:,:,trial));% 计算各通道的时域特征meanVal = mean(trialData, 2);stdVal = std(trialData, 0, 2);skewnessVal = skewness(trialData, 0, 2);kurtosisVal = kurtosis(trialData, 0, 2);% 合并特征(通道×特征)trialFeatures = [meanVal, stdVal, skewnessVal, kurtosisVal];features(end+1,:) = trialFeatures(:)';
end% 3.2 特征标准化
mu = mean(features);
sigma = std(features);
normalizedFeatures = (features - mu)./sigma;%% 4. 数据集划分
cv = cvpartition(numTrials,'HoldOut',0.3);
trainIdx = training(cv);
testIdx = test(cv);trainData = normalizedFeatures(trainIdx,:);
testData = normalizedFeatures(testIdx,:);
trainLabels = labels(trainIdx);
testLabels = labels(testIdx);%% 5. SVM分类模型训练
% 参数设置
svmOptions = statset('Display','final');
kernelType = 'rbf'; % 核函数类型
C = 1; % 惩罚因子
gamma = 0.1; % RBF核参数% 训练SVM模型
svmModel = fitcsvm(trainData, trainLabels, ...'KernelFunction', kernelType, ...'BoxConstraint', C, ...'KernelScale', gamma, ...'Standardize', false, ...'OptimizeHyperparameters', 'auto');%% 6. 分类评估
% 预测测试集
predictedLabels = predict(svmModel, testData);% 计算评估指标
[accuracy, cm] = calculateMetrics(testLabels, predictedLabels);%% 7. 结果可视化
% 混淆矩阵
figure;
confusionchart(cm);
title('Confusion Matrix');% ROC曲线
figure;
[~,~,~,auc] = perfcurve(testLabels, predictedLabels, 1);
plot(1-specificity, sensitivity);
xlabel('False Positive Rate');
ylabel('True Positive Rate');
title(['ROC Curve (AUC = ', num2str(auc), ')']);%% 辅助函数:计算评估指标
function [accuracy, cm] = calculateMetrics(trueLabels, predLabels)cm = confusionmat(trueLabels, predLabels);accuracy = sum(diag(cm))/sum(cm(:));
end
代码说明与使用指南:
- 数据准备:
- 实际应用时需替换模拟数据部分,建议使用标准P300数据集(如BCI Competition III数据集)
- 数据格式要求:通道×时间点×试次的三维矩阵
- 标签应为二进制(0/1)对应非目标/目标刺激
- 预处理流程:
- 滤波:使用4阶巴特沃斯带通滤波(0.1-30Hz)
- 分段:根据P300典型潜伏期(250-600ms)截取时间窗口
- 特征提取:包含时域特征(均值、标准差、偏度、峰度)
- SVM建模:
- 使用RBF核函数
- 自动优化超参数(C和gamma)
- 包含标准化处理(需根据实际情况调整)
- 评估指标:
- 准确率(Accuracy)
- 混淆矩阵(Confusion Matrix)
- ROC曲线及AUC值
支持向量机 进行P300检测分类,数据预处理以及分类代码
实际应用改进建议:
-
数据增强:
% 添加噪声鲁棒性训练 noisyTrainData = trainData + 0.1*randn(size(trainData)); svmModel = fitcsvm([trainData; noisyTrainData], [trainLabels; trainLabels]);
-
特征选择:
% 使用递归特征消除(RFE) rfe = fscchi2(); svmModel = fitcsvm(trainData, trainLabels, 'FeatureSelection', rfe);
-
参数优化:
% 网格搜索优化参数 optimVars = [optimizableVariable('C', [0.1, 100], 'Transform', 'log'),optimizableVariable('gamma', [1e-3, 1], 'Transform', 'log') ];svmModel = bayesopt(@(params)svmTraining(params,trainData,trainLabels), ...optimVars, 'IsObjectiveDeterministic', false, ...'AcquisitionFunctionName', 'expected-improvement-plus');
-
跨被试适应:
% 使用CSP空间滤波增强特征 [filters, ~] = csp(trainData); filteredTrain = filters * trainData; filteredTest = filters * testData;
注意事项:
- 需安装Statistics and Machine Learning Toolbox
- 对于多被试数据应采用分层交叉验证
- 建议使用EEGLab工具箱进行专业EEG处理
- 实际数据需进行ICA去除眼动伪迹
- 考虑不同分类器的集成方法(如SVM+随机森林)
对于实际应用,建议处理流程:
原始EEG数据 → ICA去噪 → 特征提取(时频域结合) → SVM分类 → 模型优化 → 在线测试
可根据具体实验设置调整以下参数:
- 滤波范围(儿童数据可能需要更低频段)
- 时间窗口(根据任务类型调整)
- 特征组合(可添加小波系数、熵值等)
- 分类器参数(尝试不同核函数)