迁移MobileNetV3的玉米病害识别方法

史宝明; 贺元香; 赵霞

doi:10.20176/j.cnki.nxdz.000044

宁夏大学学报(自然科学版中英文） ›› 2026, Vol. 47 ›› Issue (1) : 42 -49. DOI: 10.20176/j.cnki.nxdz.000044

信息科学

迁移MobileNetV3的玉米病害识别方法

史宝明 ¹ ,
贺元香 ¹ ,
赵霞 ²

作者信息 +

Transferred MobileNetV3 Method for Corn Disease Recognition

Author information +

文章历史 +

PDF (1307K)

摘要

提出了一种基于迁移学习MobileNetV3的玉米病害识别方法。该方法通过在线增强的方式扩充训练样本，将MobileNetV3-Small网络在ImageNet数据集上的学习结果作为预训练权重，构建迁移学习模型。采用深度可分离卷积模块降低模型参数量，同时引入通道注意力机制和H-Swish激活函数，提升模型识别精度和效率。采用Adam优化器和交叉熵损失函数训练迁移后的顶层分类器。实验结果表明，模型在测试集上的准确率达到95.68%。在此基础上，解冻迁移模型的后1/3层，并通过调整学习率和优化器参数对模型进行微调，最终测试准确率提升至98.15%，较微调前提高了2.47%。

Abstract

A method of corn disease recognition based on transfer learning using MobilenetV3 is proposed. The training dataset is augmented through online data enhancement， and the learning results of the MobilenetV3-Small network on the ImageNet dataset are utilized as pre-trained weights to construct the transfer learning model. A deep separable convolution module is adopted to reduce the model’s parameters count. Additionally， a channel attention mechanism and the H-Swish activation function are incorporated to enhance both the accuracy and efficiency of the model’s recognition capabilities. The Adam optimizer and cross-entropy loss function are used to train the top-level classifier after migration. Experimental results show that the model achieves an accuracy of 95.68% on the test set. Subsequently， the last one-third of layers in the transfer model are unfrozen， and the model is well tuned by adjusting the learning rate and optimizer parameters， resulting in a final test accuracy of 98.15%， which is an improvement of 2.47% compared to the pre-tuning accuracy.

Graphical abstract

关键词

迁移学习 / 微调 / MobileNetV3 / 卷积神经网络 / 玉米病害

Key words

transfer learning / fine tuning / MobileNetV3 / convolutional neural network / corn diseases

引用本文

引用格式 ▾

[Author(id=1256193280858886764, tenantId=1045748351789510663, journalId=1155139928303341779, articleId=1256193278996615717, orderNo=0, firstName=null, middleName=null, lastName=null, nameCn=null, orcid=null, stid=null, country=null, authorPic=null, dead=0, email=zlsbm@qq.com, emailSecond=null, emailThird=null, correspondingAuthor=0, authorType=1, ext={EN=AuthorExt(id=1256193280921801328, tenantId=1045748351789510663, journalId=1155139928303341779, articleId=1256193278996615717, authorId=1256193280858886764, language=EN, stringName=Baoming SHI, firstName=Baoming, middleName=null, lastName=SHI, prefix=null, suffix=null, authorComment=null, nameInitials=null, affiliation=null, department=null, xref=¹, address=^1.School of Digital Media，Lanzhou University of Arts and Sciences，Lanzhou 730010，China, bio=null, bioImg=null, bioContent=null, aboutCorrespAuthor=null), CN=AuthorExt(id=1256193280967938674, tenantId=1045748351789510663, journalId=1155139928303341779, articleId=1256193278996615717, authorId=1256193280858886764, language=CN, stringName=史宝明, firstName=null, middleName=null, lastName=null, prefix=null, suffix=null, authorComment=null, nameInitials=null, affiliation=null, department=null, xref=¹, address=^1.兰州文理学院数字媒体学院，甘肃兰州 730010, bio={"content":"

史宝明（1981—），男，副教授，硕士，主要从事深度学习、计算机视觉研究，（电子信箱）zlsbm@qq.com。

"}, bioImg=null, bioContent=

史宝明（1981—），男，副教授，硕士，主要从事深度学习、计算机视觉研究，（电子信箱）zlsbm@qq.com。

, aboutCorrespAuthor=null)}, companyList=[AuthorCompany(id=1256193280716280418, tenantId=1045748351789510663, journalId=1155139928303341779, articleId=1256193278996615717, xref=1., ext=[AuthorCompanyExt(id=1256193280728863331, tenantId=1045748351789510663, journalId=1155139928303341779, articleId=1256193278996615717, companyId=1256193280716280418, language=EN, country=null, province=null, city=null, postcode=null, companyName=null, departmentName=null, remark=^1.School of Digital Media，Lanzhou University of Arts and Sciences，Lanzhou 730010，China), AuthorCompanyExt(id=1256193280745640549, tenantId=1045748351789510663, journalId=1155139928303341779, articleId=1256193278996615717, companyId=1256193280716280418, language=CN, country=null, province=null, city=null, postcode=null, companyName=null, departmentName=null, remark=^1.兰州文理学院数字媒体学院，甘肃兰州 730010)])]), Author(id=1256193281014076021, tenantId=1045748351789510663, journalId=1155139928303341779, articleId=1256193278996615717, orderNo=1, firstName=null, middleName=null, lastName=null, nameCn=null, orcid=null, stid=null, country=null, authorPic=null, dead=0, email=null, emailSecond=null, emailThird=null, correspondingAuthor=0, authorType=1, ext={EN=AuthorExt(id=1256193281076990585, tenantId=1045748351789510663, journalId=1155139928303341779, articleId=1256193278996615717, authorId=1256193281014076021, language=EN, stringName=Yuanxiang HE, firstName=Yuanxiang, middleName=null, lastName=HE, prefix=null, suffix=null, authorComment=null, nameInitials=null, affiliation=null, department=null, xref=¹, address=^1.School of Digital Media，Lanzhou University of Arts and Sciences，Lanzhou 730010，China, bio=null, bioImg=null, bioContent=null, aboutCorrespAuthor=null), CN=AuthorExt(id=1256193281123127931, tenantId=1045748351789510663, journalId=1155139928303341779, articleId=1256193278996615717, authorId=1256193281014076021, language=CN, stringName=贺元香, firstName=null, middleName=null, lastName=null, prefix=null, suffix=null, authorComment=null, nameInitials=null, affiliation=null, department=null, xref=¹, address=^1.兰州文理学院数字媒体学院，甘肃兰州 730010, bio=null, bioImg=null, bioContent=null, aboutCorrespAuthor=null)}, companyList=[AuthorCompany(id=1256193280716280418, tenantId=1045748351789510663, journalId=1155139928303341779, articleId=1256193278996615717, xref=1., ext=[AuthorCompanyExt(id=1256193280728863331, tenantId=1045748351789510663, journalId=1155139928303341779, articleId=1256193278996615717, companyId=1256193280716280418, language=EN, country=null, province=null, city=null, postcode=null, companyName=null, departmentName=null, remark=^1.School of Digital Media，Lanzhou University of Arts and Sciences，Lanzhou 730010，China), AuthorCompanyExt(id=1256193280745640549, tenantId=1045748351789510663, journalId=1155139928303341779, articleId=1256193278996615717, companyId=1256193280716280418, language=CN, country=null, province=null, city=null, postcode=null, companyName=null, departmentName=null, remark=^1.兰州文理学院数字媒体学院，甘肃兰州 730010)])]), Author(id=1256193281169265278, tenantId=1045748351789510663, journalId=1155139928303341779, articleId=1256193278996615717, orderNo=2, firstName=null, middleName=null, lastName=null, nameCn=null, orcid=null, stid=null, country=null, authorPic=null, dead=0, email=null, emailSecond=null, emailThird=null, correspondingAuthor=0, authorType=1, ext={EN=AuthorExt(id=1256193281232179841, tenantId=1045748351789510663, journalId=1155139928303341779, articleId=1256193278996615717, authorId=1256193281169265278, language=EN, stringName=Xia ZHAO, firstName=Xia, middleName=null, lastName=ZHAO, prefix=null, suffix=null, authorComment=null, nameInitials=null, affiliation=null, department=null, xref=², address=^2.College of Information Science and Technology，Gansu Agricultural University，Lanzhou 730070，China, bio=null, bioImg=null, bioContent=null, aboutCorrespAuthor=null), CN=AuthorExt(id=1256193281278317186, tenantId=1045748351789510663, journalId=1155139928303341779, articleId=1256193278996615717, authorId=1256193281169265278, language=CN, stringName=赵霞, firstName=null, middleName=null, lastName=null, prefix=null, suffix=null, authorComment=null, nameInitials=null, affiliation=null, department=null, xref=², address=^2.甘肃农业大学信息科学技术学院，甘肃兰州 730070, bio=null, bioImg=null, bioContent=null, aboutCorrespAuthor=null)}, companyList=[AuthorCompany(id=1256193280787583591, tenantId=1045748351789510663, journalId=1155139928303341779, articleId=1256193278996615717, xref=2., ext=[AuthorCompanyExt(id=1256193280804360808, tenantId=1045748351789510663, journalId=1155139928303341779, articleId=1256193278996615717, companyId=1256193280787583591, language=EN, country=null, province=null, city=null, postcode=null, companyName=null, departmentName=null, remark=^2.College of Information Science and Technology，Gansu Agricultural University，Lanzhou 730070，China), AuthorCompanyExt(id=1256193280816943721, tenantId=1045748351789510663, journalId=1155139928303341779, articleId=1256193278996615717, companyId=1256193280787583591, language=CN, country=null, province=null, city=null, postcode=null, companyName=null, departmentName=null, remark=^2.甘肃农业大学信息科学技术学院，甘肃兰州 730070)])])] 史宝明,贺元香,赵霞. 迁移MobileNetV3的玉米病害识别方法[J]. 宁夏大学学报(自然科学版中英文）, 2026, 47(1): 42-49 DOI:10.20176/j.cnki.nxdz.000044

登录浏览全文

4963

注册一个新账户忘记密码

玉米是我国主要的粮食作物之一，同时也是重要的经济作物。其不仅是畜牧业、养殖业等产业的核心饲料来源，还是食品加工、轻工业、医疗卫生、化学工业等领域的重要生产原料。玉米病害的发生会对其产量造成显著影响，其中灰斑病、大斑病、锈病等为常见病害。因此，及早并准确地识别玉米病害类型，同时采取针对性的防治措施，是保障玉米高产稳产的关键前提。

随着深度学习技术的飞速发展，尤其是自2012年AlexNet模型被提出以来^［1］，卷积神经网络（convolutional neural network， CNN）迎来了爆发式的发展阶段。VGG^［2］、GoogLeNet^［3-6］、ResNet^［7］、DenseNet^［8］等一系列经典的卷积神经网络模型相继被提出，并在图像识别领域得到了广泛的应用与推广。与此同时，国内众多研究者基于上述经典网络开展了多种改进研究^［9-15］，并将改进后的模型应用于番茄、玉米、苹果、葡萄、油茶、棉花等农作物的病害识别任务中，均取得了理想的应用效果。

然而，传统卷积神经网络普遍存在网络层数多、参数量大的问题，对硬件设备的计算能力要求较高，因此更适合部署于PC端，难以直接应用于手机等移动终端设备。对于农业病害识别任务而言，开发可部署在手机等便携式移动终端的轻量级神经网络识别系统^［16-17］，具有更为广阔的市场应用前景。随着 Xception^［18］、ShuffleNet^［19-20］、MobileNet^［21-22］等一系列轻量级神经网络模型的相继提出，国内研究者开始尝试将这类模型应用于农作物病害识别领域。

刘洋等^［23］针对MobileNet与InceptionV3网络实施迁移学习，实现了对 PlantVillage公共数据集与自建葡萄叶片病害数据集的有效识别，并对两种模型的识别性能展开了系统的对比分析。孙俊等^［24］以MobileNetV2为基础模型，引入轻量级坐标注意力机制与多尺度特征融合技术对其进行改进，在包含11类病害叶片与4类健康叶片的数据集上完成了识别验证，模型分类精度较原模型提升了 2.91%。贾鹤鸣等^［25］基于VGG网络，引入深度可分离卷积与全局平均池化技术，构建了一款轻量级网络模型，并在PlantVillage数据集上进行了验证，取得了良好的识别效果。李好等^［26］提出一种改进ShuffleNetV2的轻量级农作物病害识别方法，所提模型兼具参数量小与识别准确率高的优势。李书琴等^［27］基于多尺度特征融合模块与下采样模块，设计并提出了一种轻量级农作物病害识别网络，该模型具有网络参数少、错误识别率低的特点。徐振南等^［28］提出一种基于轻量级卷积神经网络MobileNetV3的识别模型，通过迁移学习的方式实现了对马铃薯叶部病害的高效识别，识别准确率高达98.00%。上述研究成果为农作物病害识别模型在移动设备、嵌入式设备等资源受限平台的部署与应用，提供了重要的理论参考与技术支撑。

上述研究成果表明，轻量级卷积神经网络模型可在大幅压缩网络参数量的同时，保持较高的分类识别准确率，能够满足移动端等资源受限设备的部署要求，完全适配农业病害识别的实际应用场景。为此，本文提出一种基于迁移学习的MobileNetV3玉米病害识别方法，分别从数据预处理、模型迁移、模型微调三个关键环节开展针对性改进。本研究选取分类准确率与损失函数作为模型的核心评价指标，对改进后的网络模型进行全面的性能评估。实验结果验证了所提方法的有效性与优越性，可为轻量级移动端农作物病害识别系统的开发提供坚实的技术支撑。

1 数据处理

1.1 玉米病害数据集

研究采用的数据集图像来源于公开数据集PlantVillage中的玉米叶片病害子集，包含4类样本：健康玉米叶片图像1 162张、玉米锈病图像1 192张、玉米大斑病图像1 000张、玉米灰斑病图像1 000张。对应的4类数据标签分别为Corn_healthy、Corn_Common-rust、Corn_NorthernBlight、Corn_CercosporaGray-spot。玉米病害数据集的样本示例如图1所示。

研究将玉米病害数据集按照7∶2∶1的比例划分为训练集、验证集与测试集。结合实验所用计算机的硬件配置，将批次大小（Batch_Size）的参数值设置为16。划分后的各数据集详细信息如表1所示。

1.2 数据增强

研究所用数据集存在样本总量偏少、类别分布不均衡的问题，直接采用该数据集训练模型易引发过拟合现象。针对这一缺陷，可通过数据增强技术扩充样本数量并提升样本多样性。图像数据增强的实现方式为：对原始样本图像执行几何变换（如平移、旋转、缩放、翻转、错切等）或像素变换（如添加噪声、图像模糊、对比度调节、亮度与饱和度调整、白平衡校正等），从而生成新的训练样本。通过上述方式扩充样本数据，不仅能有效缓解数据集分布不均衡的问题，提升模型的泛化能力，还可显著抑制模型的过拟合风险。本研究选取水平翻转、随机旋转、随机缩放、随机对比度调节四种策略进行数据增强，增强效果如图 2 所示。

1.3 数据的归一化处理

数据归一化是指将原始数据的数值范围统一映射至固定区间的预处理操作，常见的归一化区间包括［0，1］或［-1，1］。该操作不仅能有效避免模型在训练过程中出现梯度爆炸或梯度消失的问题，还可显著加快模型的收敛速度。为使输入数据与迁移学习模型的输入要求相匹配，本研究在模型训练前对全体数据集执行统一的归一化处理，将所有图像数据的像素值均映射至［-1，1］区间，以保障模型训练的稳定性与高效性。变换公式为

N o r m a l i z a t i o n (x) = x / 127 - 1

。（1）

2 理论基础

2.1 迁移学习和微调

迁移学习是一种经典的机器学习方法^［29］，其核心思想是将在源任务上预训练完成的模型迁移至目标任务中进行复用。该方法的基本理念为：若一个模型基于足够大且具备通用性的数据集训练完成，则其网络结构中已学习到通用图像分类任务所需的基础视觉特征，此时该模型可有效作为视觉领域的通用特征提取器。在面对同类型的其他分类任务时，研究人员可直接利用这些预学习的特征权重进行预测，而无需从零开始训练全新模型。

基于预训练模型开展新样本数据的训练，其典型实现流程为：移除原模型顶层的分类器，构建并添加适配新任务数据分布的新分类器；随后冻结原模型的所有可训练权重参数，仅基于新数据集对新增分类器进行训练。由于原模型的大量参数无需参与训练，仅需优化新分类器的少量权重参数，因此模型的训练收敛速度可得到显著提升。

对于深度神经网络模型而言，其浅层网络通常负责学习简单且通用的基础视觉特征，这类特征具备较强的泛化能力，可适用于绝大多数图像识别任务；而网络的深层结构所提取的特征，与目标分类任务中图像的语义信息关联度更高，具有更强的任务特异性。基于这一特性，研究人员可通过微调模型深层的可训练参数，进一步提升模型在特定任务上的性能表现。

具体而言，当将一个基于大型通用数据集预训练完成的模型，通过迁移学习的方式适配新的目标数据集后，可采取如下微调策略：解冻模型后半部分的网络层，在迁移学习已训练的模型参数基础上，对解冻层的参数进行精细化调整，从而使模型更好地拟合新任务的数据集分布。

2.2 MobileNetV3网络

MobileNet是由Google公司提出的轻量级卷积神经网络系列模型，其核心优势在于模型体积小、计算效率高，非常适合部署于移动终端设备。该系列模型目前已迭代至MobileNetV3版本。MobileNetV3在前代模型的基础上，创新性地采用了深度可分离卷积与带线性瓶颈的逆残差结构，同时引入通道注意力机制，并使用 H-Swish激活函数替代传统的ReLU激活函数，使模型的分类精度与推理效率均得到显著提升。

MobileNetV3包含MobileNetV3-Small与MobileNetV3-Large两个版本，分别适用于对硬件资源有不同要求的应用场景。本研究选取MobileNetV3-Small作为基础模型进行改进，其具体的网络结构如表2所示。

可以看到，MoblieNetV3结构主要由bneck块组成，bneck块的结构见图3。

图3所示的 bneck 模块中，首先通过1×1卷积核完成升维操作，随后执行深度可分离卷积，实现特征提取与特征融合的解耦设计。该深度可分离卷积的具体流程为：先采用3×3卷积核进行分通道特征提取（深度卷积，DepthWise Convolution， DW），再通过1×1卷积核完成通道数的调整（逐点卷积，PointWise Convolution， PW）。在通道数调整阶段，本模块引入了通道注意力机制（channel attention mechanism， CAM），其实现过程为：先对特征图进行全局平均池化，随后依次经过全连接层与ReLU6激活函数、全连接层与 H-Swish 激活函数，为不同特征通道分配自适应权重。最后，模块执行残差跳跃连接运算。上述设计可大幅减少模型的参数量，在实现模型轻量化的同时，有效提升模型的综合性能。

研究表明，在深层神经网络模型中，Swish激活函数的性能优于ReLU激活函数；而H-Swish函数的输出特性与Swish函数高度逼近，且计算复杂度更低。为此，MobileNetV3网络模型在首层与深层网络中均采用 H-Swish函数替代ReLU函数，以此大幅降低模型的计算开销，提升推理效率。这一设计的核心原因在于：Swish函数的实现依赖含指数运算的Sigmoid函数，其计算过程耗时较长，这一缺陷在轻量级网络中表现得尤为突出；而H-Swish函数则基于ReLU6函数实现，有效规避了这一问题。ReLU系列函数的核心优势体现在两个方面：其一，计算量极低，可适配各类软硬件计算平台；其二，能够有效消除潜在的数值精度损失。相关激活函数的定义为

σ x = S i g m o i d (x) = 1 / (1 + e x) ，

S w i s h (x) = x ∙ σ (x)

，

R e L U 6 = m i n (m a x (0, x), 6)

，

H

S i g m o i d (x) = R e L U 6 (x + 3) / 6

，

H

S w i s h (x) = x ∙ R e L U 6 (x + 3) / 6

。

其中

σ x

为Sigmoid函数。Sigmoid、 H-Sigmoid、Swish、 H-Swish激活函数的曲线对比见图4。

可以看到，H-Swish函数的图像与Swish函数的图像基本重合，但H-Swish函数去除了指数运算，计算效率要高很多，因此完全可以用H-Swish代替Swish函数。

2.3 评价指标

在图像分类和识别任务中，准确率（accuracy）是评估检测模型性能最常用的指标之一。它反映了在给定的测试数据集中，模型正确分类的样本数与总样本数之比。准确率定义为

A c c u r a c y ＝ (T P + T N) / N

。

其中：T_P表示正样本被正确识别的数量；T_N表示负样本被正确识别的数量；N表示样本总数。

3 模型改进

3.1 迁移模型

下面基于MobileNetV3-Small模型开展改进工作：移除该模型的顶层结构，新增全局平均池化层、Dropout层，以及用于分类的全连接层。考虑到玉米病害的类别数为4类，将最后一层全连接层的神经元数量设置为4，并采用Softmax作为激活函数。改进后的MobileNetV3-Small网络模型结构如表3所示。

在上述改进模型中，首先将预处理后的图像数据统一调整为224 px×224 px尺寸，随后输入至网络的Input层；其中，Augmentation为系列数据增强层，Preprocess_Input为输入预处理层，主要完成数据的标准化操作。经预处理后的特征数据送入基础模型进行特征提取，输出尺寸为7×7×1 024的特征图；该特征图先通过GlobalAveragePooling2D层完成全局平均池化处理，为抑制模型过拟合，引入Dropout层进行正则化，其丢弃概率参数设置为0.2；Dropout层的输出结果送入全连接层，最终输出图像的分类结果。参数统计结果显示：基础模型的可训练参数数量为 1 529 968 个，最后一层Dense层的可训练参数数量为4 100个；在迁移学习训练阶段，冻结基础模型的所有参数，仅对最后一层 Dense层的参数进行训练即可。

3.2 微调模型

在本迁移学习模型中，训练过程仅针对基模型顶层新增的分类器展开，基模型的原有参数全程处于冻结状态，未参与训练更新。这一局限性可通过微调（fine-tuning）策略加以改进。微调的核心步骤之一是确定解冻位置，常规的优化方案为选取模型深度的2/3 处作为分界点：保持前2/3层的参数冻结状态不变，仅对后1/3层的参数进行解冻训练。具体操作流程为：先将基模型的所有层全部解冻，再通过循环遍历的方式，对前2/3层的参数逐层重新冻结，以确保分界点的精准控制。训练开始前，需对学习率（learning rate）进行重新设定。此处应采用更小的学习率，例如将迁移学习阶段的学习率缩小至原来的 1/10。这是由于较大的学习率易导致梯度下降过程中出现振荡现象，甚至引发灾难性遗忘（catastrophic forgetting），使模型丢失预训练阶段习得的特征提取能力。

4 实验验证及结果分析

4.1 实验环境

实验硬件环境：处理器为Intel^®Core™i5-6500 CPU@3.20 GBHz，NVIDIA GeForce RTX3060显卡，16 GB内存；实验软件环境：Windows10操作系统，Anaconda 集成开发环境， Python 3.8，深度学习框架为TensorFlow 2.5，CUDA版本为CUDA11.1。

4.2 迁移模型训练

从TensorFlow官方网站下载MobileNetV3-Small模型在公开图像数据集 ImageNet上的预训练权重文件，将该预训练模型作为基础模型开展结构改进。由于ImageNet数据集的图像分类类别数为1 000类，而本文针对玉米叶片图像的分类任务仅包含4类，因此需移除基础模型顶层的分类器层，重新构建并添加适配玉米叶片图像分类任务的分类器层；训练阶段先冻结基础模型的所有可训练参数，仅对新增分类器层的参数进行训练。

在模型训练过程中，采用Prefetch （∙）缓冲预取机制从磁盘中提前加载图像数据；该机制的核心逻辑为：在当前批次数据的训练过程中，预先读取并加载下一批次的训练数据，待当前批次训练完成后可直接启动下一批次的训练流程，无需等待数据读取，从而有效提升模型训练的整体效率。

鉴于玉米病害数据集存在类别分布不均衡的问题，为提升模型的泛化能力，本研究采用在线增强策略对预读取的图像数据进行实时增强处理，随后将增强后的图像数据执行归一化操作。由于MobileNet系列模型要求输入图像的像素值范围为［-1，1］，而原始图像的像素值范围为［0，255］，因此需依据式（1）完成像素值的归一化转换。需注意的是，在线增强并不会直接增加数据集的样本总量，但每个训练轮次（Epoch）中参与训练的样本会因随机在线增强操作呈现不同的特征形态；基于此，本研究通过增加训练轮次的方式，间接扩充有效训练样本的数量，以缓解数据集分布不均带来的影响。

归一化处理后的图像数据被输入至迁移学习模型中开展训练；结合实验所用计算机的硬件性能与图像数据的尺寸特征，将批次大小（batch size）设置为16，训练轮次（epoch）设置为30；优化器选用Adam优化器，初始学习率设置为 0.001，损失函数采用交叉熵损失函数，模型性能的评价指标为准确率（accuracy）。在冻结基础模型所有可训练参数后启动模型训练，训练过程中每完成一个轮次的训练，便使用验证集对模型性能进行一次评估，最终的训练结果如图5所示。

训练结果显示，经过30轮训练后，模型在训练集上的分类精度达到93.50%，在验证集上的分类精度达到95.88%；训练集上的损失函数值为0.157 5，验证集的损失函数值为0.106 2，模型在测试集上的预测准确率为95.68%。由图5可知，训练进行至第10轮后，模型精度便不再出现明显提升，且验证集指标始终显著高于训练集指标。这一现象的产生原因在于：批量归一化（batch normalization， BN）层与Dropout层在训练阶段处于工作状态，会对训练过程中的模型准确率产生一定影响；而在验证阶段，上述两层均会被关闭，因此验证集指标更能反映模型的真实性能。

模型训练完成后，基模型输出7×7×1 024的特征结果（图6）。

基础模型输出的特征图，经全局平均池化层处理后，得到一个长度为1 024的一维特征向量。该一维向量经全连接层与Softmax激活函数的连续运算，最终输出一个长度为4的一维向量，其每个元素分别对应一种玉米病害的预测概率。

4.3 微调模型

通过输出基础模型的层级信息，确定其总层数为243层。本研究选择在模型约2/3的位置调整参数冻结策略：解冻第160层及之后所有层的可训练参数，对模型进行微调训练。微调阶段将训练轮次（epoch）设置为20，优化器更换为RMSprop，同时将微调学习率调整为初始学习率的1/10。这一学习率调整策略的核心原因在于：过大的学习率易引发梯度震荡现象，导致模型出现“灾难性遗忘”，即丢失前期迁移学习阶段已学习到的特征信息。微调训练结果如图7所示，其中竖线左侧为微调前的训练结果，右侧为微调后的结果。结果显示，经过20轮微调训练后，模型性能得到显著提升：训练精度提升至98.72%，验证精度提升至97.60%；训练损失值降至0.035 7，验证损失值降至0.088 6；模型在测试集上的预测准确率达到98.15%，相较于微调前提升了2.47个百分点。微调前后的详细评价指标如表4所示。

4.4 测试结果分析

对测试集中的所有样本数据进行预测测试，并绘制对应的混淆矩阵，结果如图8所示。其中，标签0、1、2、3分别对应灰斑病、锈病、大斑病与健康叶片这四类样本。

混淆矩阵结果显示，真实标签为0的100份灰斑病叶片样本中，有4份被模型错误判定为大斑病；真实标签为2的100份大斑病叶片样本中，有5份被错误判定为灰斑病；其余类别的样本均实现了准确分类。通过对实验数据集的深入分析可知，上述分类错误的核心原因在于：部分叶片样本同时具备大斑病与灰斑病的典型视觉特征，属于数据集本身存在的类别模糊问题，而非模型结构或训练策略的缺陷。

4.5 实验结果对比分析

为验证所提方法的优越性，本研究将其与MobileNetV3、InceptionV3、Xception三种经典网络模型进行对比实验，对比指标为验证集分类准确率与损失函数值。经过50轮迭代训练后，各模型的指标变化曲线如图9所示；最终的评价指标数值对比结果如表5所示。实验结果表明，本文所提出的基于MobileNetV3的改进方法，不仅具有更高的分类准确率，其损失函数的收敛速度也显著快于其他3种对比模型。

5 结　语

本文提出一种基于MobileNetV3的改进型玉米病害识别方法。该方法将迁移学习与微调技术应用于轻量级卷积神经网络MobileNetV3，构建了一款可高效识别玉米病害的轻量级网络模型。该模型不仅具备较高的分类准确率与良好的鲁棒性，还可部署于移动终端等资源受限设备，实现玉米病害的准确、快速识别。此外，本方法具备良好的通用性与可扩展性，可推广至其他农作物的病害识别任务中，为农业病害的智能防治提供有效的技术参考与理论指导。

参考文献

原文顺序 | 出版日期 | 本文引用

[1]	KRIZHEVSKY A， SUTSKEVER I， HINTON G E. ImageNet classification with deep convolutional neural networks［J］. Communications of the ACM， 2017， 60（6）： 84-90.

[2]	SIMONYAN K， ZISSERMAN A. Very deep convolutional networks for large-scale image recognition［EB/OL］.（2014-09-04）［2023-03-14］.

[3]	SZEGEDY C， LIU W， JIA Y Q， et al. Going deeper with convolutions［C］//IEEE Conference on Computer Vision and Pattern Recognition （CVPR）. Boston， MA， USA：IEEE， 2015： 1-9.

[4]	IOFFE S， SZEGEDY C. Batch normalization： Accelerating deep network training by reducing internal covariate shift［EB/OL］. （2015-02-11）［2023-03-14］.

[5]	SZEGEDY C， VANHOUCKE V， IOFFE S， et al. Rethinking the inception architecture for computer vision［C］//IEEE Conference on Computer Vision and Pattern Recognition （CVPR）. Las Vegas， NV， USA：IEEE， 2016： 2818-2826.

[6]	SZEGEDY C， IOFFE S， VANHOUCKE V， et al. Inception-v4， inception-ResNet and the impact of residual connections on learning［J］. Proceedings of the AAAI Conference on Artificial Intelligence，2017，31（1）：4278-4284.

[7]	HE Kaiming， ZHANG Xiangyu， REN Shaoqing， et al. Deep residual learning for image recognition［C］//IEEE Conference on Computer Vision and Pattern Recognition （CVPR）. Las Vegas， NV， USA：IEEE， 2016： 770-778.

[8]	HUANG Gao， LIU Zhuang， VAN DER MAATEN L， et al. Densely connected convolutional networks［C］//IEEE Conference on Computer Vision and Pattern Recognition （CVPR）. Honolulu， HI， USA：IEEE， 2017： 2261-2269.

[9]	龙满生，欧阳春娟，刘欢，等. 基于卷积神经网络与迁移学习的油茶病害图像识别［J］. 农业工程学报， 2018， 34（18）： 194-201.

[10]	张建华，孔繁涛，吴建寨，等.基于改进VGG卷积神经网络的棉花病害识别模型［J］.中国农业大学学报， 2018，23（11）： 161-171.

[11]	方晨晨，石繁槐.基于改进深度残差网络的番茄病害图像识别［J］.计算机应用，2020，40（）：203-208.

[12]	闫龙泉，骆沛然，史伟，等.基于ResNet的唐卡检索［J］.宁夏大学学报（自然科学版），2021，42（3）：257-262.

[13]	鲍文霞，吴刚，胡根生，等. 基于改进卷积神经网络的苹果叶部病害识别［J］. 安徽大学学报（自然科学版）， 2021， 45（1）： 53-59.

[14]	樊湘鹏，周建平，许燕，等. 基于改进卷积神经网络的复杂背景下玉米病害识别［J］. 农业机械学报， 2021， 52（3）： 210-217.

[15]	何欣，李书琴，刘斌. 基于多尺度残差神经网络的葡萄叶片病害识别［J］. 计算机工程， 2021， 47（5）： 285-291.

[16]	葛道辉，李洪升，张亮，等. 轻量级神经网络架构综述［J］. 软件学报， 2020， 31（9）： 2627-2653.

[17]	马金林，张裕，马自萍，等. 轻量化神经网络卷积设计研究进展［J］. 计算机科学与探索， 2022， 16（3）： 512-528.

[18]	CHOLLET F. Xception： Deep learning with depthwise separable convolutions［C］//IEEE Conference on Computer Vision and Pattern Recognition （CVPR）. Honolulu， HI， USA：IEEE， 2017： 1800-1807.

[19]	ZHANG Xingyu， ZHOU Xinyu， LIN Mengxiao， et al. ShuffleNet： An extremely efficient convolutional neural network for mobile devices［C］//IEEE/CVF Conference on Computer Vision and Pattern Recognition. Salt Lake City，UT， USA：IEEE，2018：6848-6856.

[20]	MA Ningning， ZHANG Xiangyu， ZHENG Haitao， et al. ShuffleNet V2： Practical guidelines for efficient CNN architecture design［C］//Proceedings of the European Conference on Computer Vision. Cham： Springer International Publishing， 2018： 116-131. DOI：10.1007/978-3-030- 01264-9_8 .

[21]	HOWARD A G， ZHU Menglong， CHEN Bo， et al. MobileNets： Efficient convolutional neural networks for mobile vision applications［EB/OL］.（2017-04-17）［2023-03-14］.

[22]	HOWARD A， SANDLER M， CHEN Bo， et al. Searching for MobileNetV3［C］//IEEE/CVF International Conference on Computer Vision （ICCV）. Seoul， Republic of Korea： IEEE， 2019： 1314-1324.

[23]	刘洋，冯全，王书志.基于轻量级CNN的植物病害识别方法及移动端应用［J］.农业工程学报，2019，35（17）：194-204.

[24]	孙俊，谭文军，毛罕平，等.基于改进卷积神经网络的多种植物叶片病害识别［J］.农业工程学报，2017，33（19）：209-215.

[25]	贾鹤鸣，郎春博，姜子超.基于轻量级卷积神经网络的植物叶片病害识别方法［J］.计算机应用，2021，41（6）：1812-1819.

[26]	李好，邱卫根，张立臣.改进ShuffleNet V2的轻量级农作物病害识别方法［J］.计算机工程与应用，2022，58（12）：260-268.

[27]	李书琴，陈聪，朱彤，等.基于轻量级残差网络的植物叶片病害识别［J］.农业机械学报，2022，53（3）：243-250.

[28]	徐振南，王建坤，胡益嘉，等.基于MobileNetV3的马铃薯病害识别［J］.江苏农业科学，2022， 50（10）：176-182.

[29]	王鑫，董佳纬，史伟，等. 基于迁移网络的长江上游保护鱼类识别方法研究［J］.宁夏大学学报（自然科学版），2021，42（4）：391-396.