当前位置：首页 > news >正文

MATLAB实现GAN用于图像分类

news 2025/7/13 19:07:07

生成对抗网络（GAN）是一种强大的生成模型，由生成器（Generator）和判别器（Discriminator）组成。生成器用于生成图像，判别器用于判断图像是真实的还是生成的。在MATLAB中实现GAN用于图像分类和生成需要一些准备工作，包括数据预处理、网络定义、训练和测试等步骤。

1. 数据准备

假设我们使用MNIST数据集，这是一个包含手写数字的灰度图像数据集。

% 加载MNIST数据集
data = digitDatasetPath;
imds = imageDatastore(data, 'IncludeSubfolders', true, 'LabelSource', 'foldernames');
[imdsTrain, imdsTest] = splitEachLabel(imds, 0.8, 'randomized');% 数据预处理
preprocessFcn = @(x) imresize(x, [28 28]) / 255.0;
imdsTrain.ReadFcn = @(x) preprocessFcn(x);
imdsTest.ReadFcn = @(x) preprocessFcn(x);

2. 定义生成器和判别器

生成器和判别器可以使用MATLAB的深度学习工具箱中的层定义。

生成器

numLatentInputs = 100; % 潜在空间的维度
numImageRows = 28;
numImageCols = 28;
numChannels = 1;layersG = [featureInputLayer(numLatentInputs, 'Name', 'input')fullyConnectedLayer(7*7*256, 'Name', 'fc1')reluLayer('Name', 'relu1')reshapeLayer([7 7 256], 'Name', 'reshape1')transposedConv2dLayer(5, 128, 'Stride', 2, 'Cropping', 2, 'Name', 'tconv1')reluLayer('Name', 'relu2')transposedConv2dLayer(5, 64, 'Stride', 2, 'Cropping', 2, 'Name', 'tconv2')reluLayer('Name', 'relu3')transposedConv2dLayer(5, numChannels, 'Stride', 1, 'Cropping', 2, 'Name', 'tconv3')tanhLayer('Name', 'tanh')];

判别器

layersD = [imageInputLayer([numImageRows numImageCols numChannels], 'Name', 'input')convolution2dLayer(5, 64, 'Stride', 2, 'Padding', 2, 'Name', 'conv1')leakyReluLayer(0.2, 'Name', 'leakyrelu1')convolution2dLayer(5, 128, 'Stride', 2, 'Padding', 2, 'Name', 'conv2')leakyReluLayer(0.2, 'Name', 'leakyrelu2')fullyConnectedLayer(1, 'Name', 'fc')sigmoidLayer('Name', 'sigmoid')];

3. 定义训练循环

训练GAN需要交替训练生成器和判别器。

% 定义训练参数
numEpochs = 100;
miniBatchSize = 128;
learningRate = 0.0002;
beta1 = 0.5;
beta2 = 0.999;% 创建训练选项
options = trainingOptions('adam', ...'MaxEpochs', numEpochs, ...'MiniBatchSize', miniBatchSize, ...'InitialLearnRate', learningRate, ...'GradientDecayFactor', beta1, ...'SquaredGradientDecayFactor', beta2, ...'Shuffle', 'every-epoch', ...'Verbose', false);% 训练GAN
netG = trainNetwork(imdsTrain, layersG, options);
netD = trainNetwork(imdsTrain, layersD, options);

4. 生成图像

训练完成后，可以使用生成器生成图像。

% 生成随机噪声
numSamples = 16;
latentInputs = randn(numSamples, numLatentInputs);% 使用生成器生成图像
generatedImages = predict(netG, latentInputs);% 显示生成的图像
figure;
for i = 1:numSamplessubplot(4, 4, i);imshow(generatedImages(:, :, :, i), 'InitialMagnification', 'fit');axis off;
end