阿尔茨海默病(AD)作为一种常见的神经系统退行性疾病,其致病机制不明,尤其是对处于 AD 不同阶段的轻度认知障碍(MCI)患者的萎缩区域难以确定,导致误诊率偏高。为此,提出了基于 3 维卷积神经网络(3DCNN)和遗传算法(GA)相结合的 AD 早期辅助诊断模型。首先用 3DCNN 针对感兴趣区域(ROI)训练出候选基分类器,然后利用 GA 算法从中挑选出最优基分类器组合,最后集成起来进行分类,实现辅助诊断。同时,由于基分类器与脑区之间是一一对应的,进而可以找出具有显著分类能力的脑区。实验结果表明,AD 与正常组(NC)的分类准确率为 88.6%,转化为 AD 的 MCI(MCIc)与 NC 的分类准确率为 88.1%,未转化为 AD 的 MCI(MCInc)与 MCIc 的分类准确率为 71.3%。此外,通过对关键 ROI(即脑区)所对应的行为域数据进行统计分析,GA 筛选的关键脑区除了左延髓海马、左尾部海马和内外侧杏仁核、左海马旁回,还新发现了右颞中回前颞上沟、右扣带回背侧 23 等区域。实验得出所选脑区的功能主要影响情绪、记忆和认知等方面,这与 AD 患者出现的感情冷淡、记忆力下降、行动能力下降和认知水平下降等外在表现基本吻合。这些均表明所提方法是有效的。
引用本文: 潘丹, 邹超, 容华斌, 曾安. 基于遗传算法和三维卷积神经网络集成模型的阿尔茨海默症早期辅助诊断. 生物医学工程学杂志, 2021, 38(1): 47-55, 64. doi: 10.7507/1001-5515.201911046 复制
引言
阿尔茨海默症(Alzheimer’s disease,AD)是一种常见的神经系统退行性疾病。轻度认知障碍(mild cognitive impairment,MCI)通常被认为是 AD 的一种早期阶段,是从正常对照(normal control,NC)到 AD 的过渡状态[1],尤其是晚期 MCI 很可能发展为 AD[2],因此一般将 MCI 分为转化为 AD 的 MCI(MCI patients who will convert to AD,MCIc)和未转化为 AD 的 MCI(MCI patients who will not convert to AD,MCInc)。据国际阿尔茨海默病组织(Alzheimer's Disease International)公布[3],2018 年全球有 5 000 万 AD 患者,到 2050 年,这一数字将增至 1.52 亿人。尽管目前还缺乏有效治愈 AD 的方法,但对 AD 进行早期干预可以延缓其发展进程。而且,随着我国老龄化人口比重逐年递增,AD 患者人数庞大,国内众多学者也对 AD 展开了多方面的研究[4]。如何在临床上快速准确地早期诊断 AD/MCI 仍然是一个具有挑战的问题。目前,随着磁共振影像(magnetic resonance imaging,MRI)技术的发展,越来越多的研究者开始基于 MRI 医学影像对 AD 展开研究。
MRI 包括结构性核磁共振(structural MRI,sMRI)和功能性核磁共振(functional MRI,fMRI)。sMRI 是一种非侵入性、功能强大的神经成像工具,有助于捕获区域性脑萎缩和理解与 AD 相关的解剖结构的变化,特别是其捕捉到的海马和内嗅皮层的萎缩可以在一定程度上反映疾病所处的阶段,并预测 MCI 向 AD 的进展[5-6]。因此,研究者尝试从 sMRI 影像捕获 AD 疾病信息,以期获得较好的分类准确率。
有研究表明 sMRI 影像的体积、皮层厚度、皮层表面积等大脑形态学指标特征可用来诊断 AD[7]。例如,Salvatore 等[8]针对 509 张 sMRI 影像,对被试全脑影像体素采用主成分分析(principal components analysis,PCA)方法进行特征提取,然后将提取到的特征用支持向量机(support vector machine,SVM)进行训练。该方法在 AD vs. NC、MCIc vs. NC 和 MCIc vs. MCInc 等人群的分类准确率分别达到 76%、72%、66%,取得了一定的效果。但伴随图像而来的是上百万的体素,而样本的数量是有限的,容易发生过拟合。另外,传统的机器学习方法靠手工提取特征,这在很大程度上依赖于专业知识,不但耗时而且存在主观因素[9]。
近年来,深度学习尤其是深度卷积神经网络(convolutional neural network,CNN),因其强大的提取有效特征的能力而在各种医学图像分割、分类和配准等任务中得到了广泛运用[10]。如:Hosseini-Asl 等[11]提出了深度监督自适应 3D-CNN(3D-ACNN)模型。该模型特色之处在于通过自编码器提取 AD 生物标志物,实现了病症的分类。Li 等[12]将大脑 sMRI 影像划分为 27 个区域,结合 K-Means 方法对每个区域的 patches 进行分组,再采用 DenseNet[13]网络模型对分组后的 patches 进行训练,并将各个区域学习到的特性进行融合,最后进行分类。但是上述实验的参数量巨大,并且模型内存消耗大,训练时间较长。本团队[14]提出了基于 sMRI 影像三个维度的不同二维切片的基分类器集成模型,该模型通过简单 8 层网络[15]训练出基于 sMRI 的不同轴(X,Y,Z)的切片基分类器,选取单轴准确率前五名的基分类器进行简单的投票集成。该方法在 AD vs. NC、MCIc vs. NC 和 MCIc vs. MCInc 等人群的分类准确率分别达到 81%、79%、62%。尽管 2DCNN 的训练参数明显少于 3DCNN,但二维切片并没有充分利用 sMRI 的空间信息,且切片之间的相关性考虑不充分,同时,简单地按验证集上的准确率高低挑选基分类器进行集成,获得的模型不一定是最优的。在最新的研究中,Spasov 等[16]提出了一种基于三维可分离卷积的双任务学习的深度学习体系结构。该实验以 sMRI 影像、人口统计学、神经心理学和 APOe4 基因数据作为输入,实现了 MCI 向 AD 转化的预测,尽管该方法取得了较好的效果,但除图像外,其他医疗数据较难获取,因此存在一定局限。
综上所述,文献[4-6]表明,与 AD 有关的仅是部分脑区,而不是整个大脑。其他不相关脑区图像会对分类结果造成影响。因此,可根据疾病特点选择感兴趣区域(regions of interest,ROI)脑区图像作为样本。尽管目前已有一些 AD 辅助诊断模型,但这些模型不是训练难度大、耗时较长,就是仅停留在提高分类准确率的目的上,缺乏关于对 AD 早期诊断有帮助的脑区的有效判定。为解决上述问题,本文提出了基于 ROI 的 3DCNN 和遗传算法(genetic algorithm,GA)相结合的 AD 早期诊断集成模型。
1 方法
1.1 分类性能指标
本文采用了 5 种分类性能指标进行评价,分别是分类准确率(accuracy)、召回率(recall)、精度(precision)、f1 值(f1-score)和 ROC 曲线下面积(area under curve,AUC),相关计算公式如下。
![]() |
![]() |
![]() |
![]() |
上式中的 TP、TN、FP 和 FN 见表 1。

1.2 集成模型框架
由于 T1 加权(T1-Weight)图像被广泛应用,常作为 AD 诊断的首选影像[17],因此,本文采用它们来测试所提出的方法。本文提出的基于 ROI 的 3DCNN+GA 的 AD 早期诊断集成模型框架如图 1 所示,根据大脑分区模板提取 sMRI 不同的 ROI 影像,针对每个 ROI 影像基于 3DCNN 训练出对应的基分类器,最后经 GA 筛选出最优基分类器组合并进行集成分类。

1.3 3DCNN
CNN 的强大之处在于它的多层网络结构可以自动学习图像特征。浅层的卷积层学习图像局部特征,深层的卷积层对这些局部特征进行进一步学习,从而获得更加抽象的特征。研究表明,CNN 通过加深网络结构可提高网络的特征表示能力,使得图像特征信息可以通过多层网络传到分类器端,从而提高最终的分类效果[18]。但是,由于获得大量带有标记的样本较为困难,因此,为了减小过拟合风险,浅层的网络结构是首选。这样,有效构建出基于小数据样本进行分类的网络体系结构仍然非常重要[19]。于是,本文构建了如图 2 所示的精简 3DCNN 结构,主要包括三个卷积模块 Conv1(Conv1_1,Conv1_2,Pool1)、Conv2(Conv2_1,Conv2_2,Pool2)、Conv3(Conv3_1,Conv3_2,Conv3_3,Pool3)和三个全连接层(FC4,FC5,FC6)和一个 Softmax 层。

1.4 基分类器的优选
相比于文献[14]具有主观性的简单集成方法,本文通过 GA 来完成对基分类器的优选,可使选取的基分类器更具客观性。事实上,每个基分类器学习到的特征只是对应单个脑区图像的特征信息,通过集成,就可以把多个基分类器对同一未知标签样本的预测结果融合在一起,共同决定该样本的分类标签。本文采用的 GA 优选方法如图 3 所示。首先,针对每个脑区,成功训练出相应的 3DCNN 基分类器;然后,按照这些基分类器在验证集上的 f1 值指标高低对其进行排序,选出排名前 30 的基分类器;然后对这 30 个基分类器进行染色体编码(即初始化种群,1 代表选择此基分类器,0 代表不选择)。经过 GA 算法的不断迭代寻优,最终筛选出 ROI 关键基分类器组合进行集成,以此决定最终的预测结果。本模型最大特点在于利用 GA 来挑选具有显著分类效果的 3DCNN 基分类器。这样,不但可以实现 AD 分类,还可分析挑选出的脑区所对应的行为域,发现与 AD 有关的生物标志物,进而为临床的治疗提供一定的帮助。

2 实验
2.1 数据集及预处理
本文使用的 sMRI 影像来自阿尔茨海默病神经影像学倡议(Alzheimer’s Disease Neuroimaging Initiativ,ADNI)数据库(www.loni.ucla.edu/adni)。ADNI 于 2003 年由美国国家老龄研究所(National Institute of Aging,NIA)、美国国家生物医学成像和生物工程研究所(National Institute of Biomedical Imaging and Bioengineering,NIBIB)、美国食品和药物管理局(Food and Drug Administration,FDA)、私营制药公司和非营利组织共同发起的。ADNI 的主要目标是发现对 AD 早期阶段诊断最有效的方法,为相关研究人员节省成本并为治疗提供辅助,并为全球研究者展开共同合作和数据共享提供便利。
本文从 ADNI 数据库下载的 sMRI 影像数据划分为四类人群:① 正常对照组(NC);② 重度认知障碍类(转化为 AD 型,MCIc);③ 轻度认知障碍类(未转化为 AD 型,MCInc);④ 阿尔茨海默病类(AD)。总共下载了 787 张 T1-Weight 的 sMRI 影像,包括 262 张 NC 影像、237 张 AD 影像、173 张 MCInc 影像和 115 张 MCIc 影像。在数据的使用上,本文将数据分为两部分,其中一部分用于本模型训练和测试,记作训练&&测试集(n = 509);另外一部分作为验证集(n = 278),相关被试的详细信息如表 2 和表 3 所示。


由于从 ADNI 数据库下载的图像都为.nii 格式,实验利用基于 MATLAB 软件的 CAT12 工具包(http://dbm.neuro.uni-jena.de/cat/)进行图像预处理,预处理包括去头骨,配准到蒙特利尔神经病学研究所(Montreal Neurological Institute,MNI)标准空间中,图像平滑(平滑核为 2 × 2 × 2),参数使用 CAT12 工具包默认参数。随后对每个 sMRI 进行灰度归一化,使灰度值在 0~1 之间,有利于模型加速收敛,预处理流程如图 4 所示。

2.2 ROI 图像提取
由于 AD 的产生同时伴随着颞叶和海马体的萎缩,这些变化可以通过 sMRI 进行测量。文献[20]已经证实,AD 与脑萎缩有密切关系,而脑萎缩主要反映在皮层表面积的缩小及皮质厚度降低和灰质体积减少上,因此,这一步的目的是根据大脑分区模板从 sMRI 影像提取出 ROI 图像。
如图 5 所示,分别为被试的左海马区域(L.cHipp)、右海马旁回区域(R.A28/34)、左杏仁核区域(L.mAmyg)等 ROI 图像切片。具体做法:当经过预处理后的 sMRI 影像在大小和坐标空间与 Brainnetome Atlas[21]模板一致时,根据模板划分脑区的掩码(Mask)提取特定脑区的图像作为本模型的输入样本。

2.3 实验设置
本文利用 ADNI 数据库中 787 名被试的 T1-Weight 的 sMRI 影像进行 AD 分类实验。图像处理过程如第 2.1 节所示,处理后 sMRI 影像大小为 91 × 109 × 91,图像分辨率为 2 mm3。3DCNN 模型参数如表 4 所示。

训练时,整个网络的权重默认 Glorot 等[22]初始化的方法。Batch_size 为 4,Epochs 为 40,采用 Adam[23]梯度下降方法进行参数的更新,学习率为 0.001,Dropout 为 0.25,并且对参数进行了 L2 正则化来降低过拟合风险。另外,GA 种群数为 30,总共迭代 6 000 次,交叉概率设为 0.75,变异概率设为 0.05,f1 值作为适应度值。由于 GA 一般收敛速度慢,会因所有群体出现同一极值而导致停止进化,即早熟现象。又因为适应度值间差别小,故对种群适应度值选择进行了放大操作。
![]() |
![]() |
公式(5)(6)中 fitvalue 表示当前迭代次数的所有种群各自适应度值,pi 则为各个种群被选择的概率。测试时,把经预处理后的 sMRI 影像输入到经 GA 筛选获得的集成模型中,获得最终的测试结果。实验采用了 5 种分类性能指标进行评价(如 1.1 节所示)。
2.4 实验方案
所有实验均在同一个服务器上运行。服务器总共有 5 个节点,每个节点分别配置了 2 块显存为 16 GB、最大功耗为 250 W 的 NVIDIA 的 Tesla P100 GPU 显卡。本文实现了以下模型:
(1)3DCNN,利用被试的全脑 sMRI 影像来训练本文的 3DCNN 模型。
(2)3DCNN+Ensemble,先根据 2.2 节方法,利用 Brainnetome Atlas 模板从 sMRI 中提取出每个脑区的 ROI 图像,总共 246 个脑区,然后,将每个脑区的 ROI 图像用于训练一个 3DCNN 模型,即得到 246 个 3DCNN 基分类器。接着,利用验证集获得每个基分类器的 f1 值,进行排序后,取出排名前 30 的 3DCNN 基分类器进行简单投票集成。
(3)3DCNN+GA,先根据 2.2 节方法,利用 Brainnetome Atlas 模板从 sMRI 中提取出每个脑区的 ROI 图像,总共 246 个脑区,然后,将每个脑区的 ROI 图像用于训练一个 3DCNN 模型,即得到 246 个 3DCNN 基分类器。最后根据 1.4 节,对排名前 30 的 ROI 基分类器进行编码,适应值为 f1 值,再用 GA 在验证集上筛选出最优 3DCNN 基分类器组合,最后对测试集中样本进行简单投票集成测试。
3 实验结果
3.1 方法结果比较
在本文中,实验使用 5 折分层交叉验证策略来训练和测试所提出方法,以减少随机因素影响。然后采用验证集数据(见表 3),并利用改进的 GA 算法,完成 3DCNN 基分类器的挑选,取在验证集上的预测结果中最好的结果所对应的脑区组合作为最终集成模型。每种指标可得 5 次结果,取其平均值作为性能指标。所提方法在 AD vs. NC、MCIc vs. NC 和 MCIc vs. MCInc 的 5 种指标结果,即准确率、AUC、召回率、精度和 f1 值及其对应的标准差如表 5 所示。

为了和其他方法进行公平比较,选择了实验所用的训练集和测试集数据与本文相同的文献[8,14],并做了多组对比试验。其他文献虽使用了 ADNI 数据库的数据,但具体挑选的数据集并不一样,同时 MCI 的划分也存在不同,因此,较难直接进行精确比较。于是,本文选择了在不同样本中分类效果比较好的文献方法进行了大致比较。例如,有些实验把 MCI 划分为进展型 MCI(progressive MCI,pMCI)和稳定型 MCI(stable MCI,sMCI),这在某种程度上与本文的 MCIc 以及 MCInc 相对应。表 6 给出了各方法的实验分类准确率和样本数量。Yang 等[24]通过独立主成分分析(independent components analysis,ICA)提取图像特征,然后将提取到的特征用 SVM 进行训练,最终实现 AD 的预测。文献[25]把 Bagging 和 SVM 相结合实现 AD/NC 的分类。李书通等[26]提出了一种基于非监督学习的 3D-PCANet 方法,实现了 AD 辅助诊断。文献[2]基于堆栈自编码器对 AD 进行分类。文献[10]通过提取图像局部密度特征,并结合图的示例学习技术完成了对 AD 的分类。

本方法的 3DCNN 网络的参数量总共为 31 610 258,单个 ROI 模型训练需要 0.78 h,大小为 361.83 MB,一个 ROI 基分类器的五折交叉验证模型则耗费 3.9 h 左右,总共 246 个脑区,因此,完成一组分类实验将花费 959.4 h,合计约 40 天,最终完成整个实验训练约需耗费 120 天左右。尽管从训练周期来看,时间成本巨大,但从实验结果来看,分类准确率显著提高。此外,经 GA 算法挑选后,在验证集上取得最高 f1 值的 ROI 脑区通过 BrainNet Viewer[27]进行三维可视化,如图 6 所示。

3.2 行为域值统计结果
本实验根据 Brainnetome Atlas 官网的各脑区行为域数据,对上述脑区统计出 AD vs. NC、MCIc vs. NC 和 MCIc vs. MCInc 各显著脑区的相关行为域数据,然后分别分析出各组实验中根据 GA 算法挑选的较显著的脑区 ROI 区域主要影响哪些行为,每组实验统计结果是取每个脑区行为域值最高的前三项(例如,R.mAmyg 脑区行为域域值最高的前三项分别为:Emotion.anger 域值为 5.02,Emotion.sadness 域值为 8.78,Emotion.disgust 域值为 7.87),然后对相同行为域对应的域值进行累加,最终得到如图 7 所示的统计图。

4 讨论与总结
本文提出了基于脑区 ROI 的 3DCNN 和 GA 结合 AD 早期辅助诊断集成模型。模型中的每个基分类器是每个 ROI 图像用 3DCNN 模型训练出来的,然后对这些基分类器按 f1 值进行排序筛选,这比 Aderghal 等[28]使用先验知识只选取海马体的图像训练 CNN 模型更为合理。实验所有 sMRI 影像均来自 ADNI 数据库,在与文献[8,14]使用的数据完全相同的情况下做了多组对比实验,来检验模型的有效性。由表 5、表 6 实验结果可知,本模型具有以下特点:
(1)仅对被试全脑影像进行训练的前提下,单纯 3DCNN 的 AD vs. NC 和 MCIc vs. NC 实验准确率比文献[8]的 PCA+SVM 以及文献[14]的 2DCNN 均有提高,表明本文 3DCNN 模型在特征提取方面具有一定优势。
(2)在提取 ROI 的前提下,3DCNN+Ensemble 和 3DCNN+GA 的实验结果明显高于单纯使用全脑影像的方法和 2DCNN 方法,一方面说明对图像提取 ROI 特征处理后,减少了其他无关特征的干扰,另一方面通过集成学习将挑选出的各个优秀基分类器集成起来共同对整个 MRI 的类别进行分类,使得最终的集成模型比单个全脑 CNN 基分类器具有更高的分类准确率和稳定性。
(3)集成模型 3DCNN+GA 比 3DCNN+Ensemble 和 2DCNN+Ensemble 效果更好,表明优化算法选出不同被试组中差异最大的 ROI 组合可以摆脱已有经验的束缚,充分利用 sMRI 的空间信息,从而相比于文献[14]简单排序投票集成,GA 算法在特征组合上更具优势,实验结果也证明了这一点。在 3DCNN+GA 方法中,AD vs. NC 的准确率为 88.6%,f1 值为 88.3%,GA 筛选的关键脑区除了左延髓海马、左尾部海马和内外侧杏仁核、左海马旁回,还新发现了了右颞中回前颞上沟、右扣带回背侧 23 等区域;MCIc vs. NC 的准确率为 88.1%,f1 值为 86.5%,GA 筛选的脑区除了右延髓海马、右尾部海马和内外侧杏仁核、左海马旁回,还新发现了了左梭状回延髓 20 等区域;MCIc vs. MCInc 的准确率为 71.3%,f1 值为 69.4%,GA 筛选的脑区为延髓海马、内外侧杏仁核、左梭状回、右扣带回背侧 23 和楔前叶背内侧枕壁沟等区域。
(4)此外,本文还对所有选出脑区的行为域值进行了分析,如图 7 所示,发现这些分类特征显著的脑区主要与情感、记忆、语言等功能相关,这与 AD 患者感情淡漠、失忆、丧失语言能力、丧失行动能力等临床表现基本一致。这进一步印证了 GA 算法所选 ROI 脑区的正确性和有效性,也表明了本研究所得到的脑区与 AD 具有较强的关联性。
当然,该方法也存在一定的局限性。例如,文献[12]认为,所有患病人群脑功能发生异常不总是发生在相同的所选 ROI 脑区,因此,固定相同的脑区可能会导致丢失用以区分患者的关键信息。这不利于更好地区分患病人群。而且,选择不同的脑区模板可能也会对分类结果有影响。另外,该模型在提高分类性能的同时,增加了训练时长。但是,一方面本研究结果在提高了 AD 诊断率的同时,还为 AD 早期诊断有帮助的脑区的有效判定提供了新思路;另一方面,sMRI 影像对脑萎缩、脑血管疾病和肿瘤等疾病的结构变化尤为灵敏[29],因此,这种方式不只局限于 AD 的辅助诊断,还可用于脑血管疾病和肿瘤等其他大脑疾病。这些将是下一步研究的方向。
利益冲突声明:本文全体作者均声明不存在利益冲突。
引言
阿尔茨海默症(Alzheimer’s disease,AD)是一种常见的神经系统退行性疾病。轻度认知障碍(mild cognitive impairment,MCI)通常被认为是 AD 的一种早期阶段,是从正常对照(normal control,NC)到 AD 的过渡状态[1],尤其是晚期 MCI 很可能发展为 AD[2],因此一般将 MCI 分为转化为 AD 的 MCI(MCI patients who will convert to AD,MCIc)和未转化为 AD 的 MCI(MCI patients who will not convert to AD,MCInc)。据国际阿尔茨海默病组织(Alzheimer's Disease International)公布[3],2018 年全球有 5 000 万 AD 患者,到 2050 年,这一数字将增至 1.52 亿人。尽管目前还缺乏有效治愈 AD 的方法,但对 AD 进行早期干预可以延缓其发展进程。而且,随着我国老龄化人口比重逐年递增,AD 患者人数庞大,国内众多学者也对 AD 展开了多方面的研究[4]。如何在临床上快速准确地早期诊断 AD/MCI 仍然是一个具有挑战的问题。目前,随着磁共振影像(magnetic resonance imaging,MRI)技术的发展,越来越多的研究者开始基于 MRI 医学影像对 AD 展开研究。
MRI 包括结构性核磁共振(structural MRI,sMRI)和功能性核磁共振(functional MRI,fMRI)。sMRI 是一种非侵入性、功能强大的神经成像工具,有助于捕获区域性脑萎缩和理解与 AD 相关的解剖结构的变化,特别是其捕捉到的海马和内嗅皮层的萎缩可以在一定程度上反映疾病所处的阶段,并预测 MCI 向 AD 的进展[5-6]。因此,研究者尝试从 sMRI 影像捕获 AD 疾病信息,以期获得较好的分类准确率。
有研究表明 sMRI 影像的体积、皮层厚度、皮层表面积等大脑形态学指标特征可用来诊断 AD[7]。例如,Salvatore 等[8]针对 509 张 sMRI 影像,对被试全脑影像体素采用主成分分析(principal components analysis,PCA)方法进行特征提取,然后将提取到的特征用支持向量机(support vector machine,SVM)进行训练。该方法在 AD vs. NC、MCIc vs. NC 和 MCIc vs. MCInc 等人群的分类准确率分别达到 76%、72%、66%,取得了一定的效果。但伴随图像而来的是上百万的体素,而样本的数量是有限的,容易发生过拟合。另外,传统的机器学习方法靠手工提取特征,这在很大程度上依赖于专业知识,不但耗时而且存在主观因素[9]。
近年来,深度学习尤其是深度卷积神经网络(convolutional neural network,CNN),因其强大的提取有效特征的能力而在各种医学图像分割、分类和配准等任务中得到了广泛运用[10]。如:Hosseini-Asl 等[11]提出了深度监督自适应 3D-CNN(3D-ACNN)模型。该模型特色之处在于通过自编码器提取 AD 生物标志物,实现了病症的分类。Li 等[12]将大脑 sMRI 影像划分为 27 个区域,结合 K-Means 方法对每个区域的 patches 进行分组,再采用 DenseNet[13]网络模型对分组后的 patches 进行训练,并将各个区域学习到的特性进行融合,最后进行分类。但是上述实验的参数量巨大,并且模型内存消耗大,训练时间较长。本团队[14]提出了基于 sMRI 影像三个维度的不同二维切片的基分类器集成模型,该模型通过简单 8 层网络[15]训练出基于 sMRI 的不同轴(X,Y,Z)的切片基分类器,选取单轴准确率前五名的基分类器进行简单的投票集成。该方法在 AD vs. NC、MCIc vs. NC 和 MCIc vs. MCInc 等人群的分类准确率分别达到 81%、79%、62%。尽管 2DCNN 的训练参数明显少于 3DCNN,但二维切片并没有充分利用 sMRI 的空间信息,且切片之间的相关性考虑不充分,同时,简单地按验证集上的准确率高低挑选基分类器进行集成,获得的模型不一定是最优的。在最新的研究中,Spasov 等[16]提出了一种基于三维可分离卷积的双任务学习的深度学习体系结构。该实验以 sMRI 影像、人口统计学、神经心理学和 APOe4 基因数据作为输入,实现了 MCI 向 AD 转化的预测,尽管该方法取得了较好的效果,但除图像外,其他医疗数据较难获取,因此存在一定局限。
综上所述,文献[4-6]表明,与 AD 有关的仅是部分脑区,而不是整个大脑。其他不相关脑区图像会对分类结果造成影响。因此,可根据疾病特点选择感兴趣区域(regions of interest,ROI)脑区图像作为样本。尽管目前已有一些 AD 辅助诊断模型,但这些模型不是训练难度大、耗时较长,就是仅停留在提高分类准确率的目的上,缺乏关于对 AD 早期诊断有帮助的脑区的有效判定。为解决上述问题,本文提出了基于 ROI 的 3DCNN 和遗传算法(genetic algorithm,GA)相结合的 AD 早期诊断集成模型。
1 方法
1.1 分类性能指标
本文采用了 5 种分类性能指标进行评价,分别是分类准确率(accuracy)、召回率(recall)、精度(precision)、f1 值(f1-score)和 ROC 曲线下面积(area under curve,AUC),相关计算公式如下。
![]() |
![]() |
![]() |
![]() |
上式中的 TP、TN、FP 和 FN 见表 1。

1.2 集成模型框架
由于 T1 加权(T1-Weight)图像被广泛应用,常作为 AD 诊断的首选影像[17],因此,本文采用它们来测试所提出的方法。本文提出的基于 ROI 的 3DCNN+GA 的 AD 早期诊断集成模型框架如图 1 所示,根据大脑分区模板提取 sMRI 不同的 ROI 影像,针对每个 ROI 影像基于 3DCNN 训练出对应的基分类器,最后经 GA 筛选出最优基分类器组合并进行集成分类。

1.3 3DCNN
CNN 的强大之处在于它的多层网络结构可以自动学习图像特征。浅层的卷积层学习图像局部特征,深层的卷积层对这些局部特征进行进一步学习,从而获得更加抽象的特征。研究表明,CNN 通过加深网络结构可提高网络的特征表示能力,使得图像特征信息可以通过多层网络传到分类器端,从而提高最终的分类效果[18]。但是,由于获得大量带有标记的样本较为困难,因此,为了减小过拟合风险,浅层的网络结构是首选。这样,有效构建出基于小数据样本进行分类的网络体系结构仍然非常重要[19]。于是,本文构建了如图 2 所示的精简 3DCNN 结构,主要包括三个卷积模块 Conv1(Conv1_1,Conv1_2,Pool1)、Conv2(Conv2_1,Conv2_2,Pool2)、Conv3(Conv3_1,Conv3_2,Conv3_3,Pool3)和三个全连接层(FC4,FC5,FC6)和一个 Softmax 层。

1.4 基分类器的优选
相比于文献[14]具有主观性的简单集成方法,本文通过 GA 来完成对基分类器的优选,可使选取的基分类器更具客观性。事实上,每个基分类器学习到的特征只是对应单个脑区图像的特征信息,通过集成,就可以把多个基分类器对同一未知标签样本的预测结果融合在一起,共同决定该样本的分类标签。本文采用的 GA 优选方法如图 3 所示。首先,针对每个脑区,成功训练出相应的 3DCNN 基分类器;然后,按照这些基分类器在验证集上的 f1 值指标高低对其进行排序,选出排名前 30 的基分类器;然后对这 30 个基分类器进行染色体编码(即初始化种群,1 代表选择此基分类器,0 代表不选择)。经过 GA 算法的不断迭代寻优,最终筛选出 ROI 关键基分类器组合进行集成,以此决定最终的预测结果。本模型最大特点在于利用 GA 来挑选具有显著分类效果的 3DCNN 基分类器。这样,不但可以实现 AD 分类,还可分析挑选出的脑区所对应的行为域,发现与 AD 有关的生物标志物,进而为临床的治疗提供一定的帮助。

2 实验
2.1 数据集及预处理
本文使用的 sMRI 影像来自阿尔茨海默病神经影像学倡议(Alzheimer’s Disease Neuroimaging Initiativ,ADNI)数据库(www.loni.ucla.edu/adni)。ADNI 于 2003 年由美国国家老龄研究所(National Institute of Aging,NIA)、美国国家生物医学成像和生物工程研究所(National Institute of Biomedical Imaging and Bioengineering,NIBIB)、美国食品和药物管理局(Food and Drug Administration,FDA)、私营制药公司和非营利组织共同发起的。ADNI 的主要目标是发现对 AD 早期阶段诊断最有效的方法,为相关研究人员节省成本并为治疗提供辅助,并为全球研究者展开共同合作和数据共享提供便利。
本文从 ADNI 数据库下载的 sMRI 影像数据划分为四类人群:① 正常对照组(NC);② 重度认知障碍类(转化为 AD 型,MCIc);③ 轻度认知障碍类(未转化为 AD 型,MCInc);④ 阿尔茨海默病类(AD)。总共下载了 787 张 T1-Weight 的 sMRI 影像,包括 262 张 NC 影像、237 张 AD 影像、173 张 MCInc 影像和 115 张 MCIc 影像。在数据的使用上,本文将数据分为两部分,其中一部分用于本模型训练和测试,记作训练&&测试集(n = 509);另外一部分作为验证集(n = 278),相关被试的详细信息如表 2 和表 3 所示。


由于从 ADNI 数据库下载的图像都为.nii 格式,实验利用基于 MATLAB 软件的 CAT12 工具包(http://dbm.neuro.uni-jena.de/cat/)进行图像预处理,预处理包括去头骨,配准到蒙特利尔神经病学研究所(Montreal Neurological Institute,MNI)标准空间中,图像平滑(平滑核为 2 × 2 × 2),参数使用 CAT12 工具包默认参数。随后对每个 sMRI 进行灰度归一化,使灰度值在 0~1 之间,有利于模型加速收敛,预处理流程如图 4 所示。

2.2 ROI 图像提取
由于 AD 的产生同时伴随着颞叶和海马体的萎缩,这些变化可以通过 sMRI 进行测量。文献[20]已经证实,AD 与脑萎缩有密切关系,而脑萎缩主要反映在皮层表面积的缩小及皮质厚度降低和灰质体积减少上,因此,这一步的目的是根据大脑分区模板从 sMRI 影像提取出 ROI 图像。
如图 5 所示,分别为被试的左海马区域(L.cHipp)、右海马旁回区域(R.A28/34)、左杏仁核区域(L.mAmyg)等 ROI 图像切片。具体做法:当经过预处理后的 sMRI 影像在大小和坐标空间与 Brainnetome Atlas[21]模板一致时,根据模板划分脑区的掩码(Mask)提取特定脑区的图像作为本模型的输入样本。

2.3 实验设置
本文利用 ADNI 数据库中 787 名被试的 T1-Weight 的 sMRI 影像进行 AD 分类实验。图像处理过程如第 2.1 节所示,处理后 sMRI 影像大小为 91 × 109 × 91,图像分辨率为 2 mm3。3DCNN 模型参数如表 4 所示。

训练时,整个网络的权重默认 Glorot 等[22]初始化的方法。Batch_size 为 4,Epochs 为 40,采用 Adam[23]梯度下降方法进行参数的更新,学习率为 0.001,Dropout 为 0.25,并且对参数进行了 L2 正则化来降低过拟合风险。另外,GA 种群数为 30,总共迭代 6 000 次,交叉概率设为 0.75,变异概率设为 0.05,f1 值作为适应度值。由于 GA 一般收敛速度慢,会因所有群体出现同一极值而导致停止进化,即早熟现象。又因为适应度值间差别小,故对种群适应度值选择进行了放大操作。
![]() |
![]() |
公式(5)(6)中 fitvalue 表示当前迭代次数的所有种群各自适应度值,pi 则为各个种群被选择的概率。测试时,把经预处理后的 sMRI 影像输入到经 GA 筛选获得的集成模型中,获得最终的测试结果。实验采用了 5 种分类性能指标进行评价(如 1.1 节所示)。
2.4 实验方案
所有实验均在同一个服务器上运行。服务器总共有 5 个节点,每个节点分别配置了 2 块显存为 16 GB、最大功耗为 250 W 的 NVIDIA 的 Tesla P100 GPU 显卡。本文实现了以下模型:
(1)3DCNN,利用被试的全脑 sMRI 影像来训练本文的 3DCNN 模型。
(2)3DCNN+Ensemble,先根据 2.2 节方法,利用 Brainnetome Atlas 模板从 sMRI 中提取出每个脑区的 ROI 图像,总共 246 个脑区,然后,将每个脑区的 ROI 图像用于训练一个 3DCNN 模型,即得到 246 个 3DCNN 基分类器。接着,利用验证集获得每个基分类器的 f1 值,进行排序后,取出排名前 30 的 3DCNN 基分类器进行简单投票集成。
(3)3DCNN+GA,先根据 2.2 节方法,利用 Brainnetome Atlas 模板从 sMRI 中提取出每个脑区的 ROI 图像,总共 246 个脑区,然后,将每个脑区的 ROI 图像用于训练一个 3DCNN 模型,即得到 246 个 3DCNN 基分类器。最后根据 1.4 节,对排名前 30 的 ROI 基分类器进行编码,适应值为 f1 值,再用 GA 在验证集上筛选出最优 3DCNN 基分类器组合,最后对测试集中样本进行简单投票集成测试。
3 实验结果
3.1 方法结果比较
在本文中,实验使用 5 折分层交叉验证策略来训练和测试所提出方法,以减少随机因素影响。然后采用验证集数据(见表 3),并利用改进的 GA 算法,完成 3DCNN 基分类器的挑选,取在验证集上的预测结果中最好的结果所对应的脑区组合作为最终集成模型。每种指标可得 5 次结果,取其平均值作为性能指标。所提方法在 AD vs. NC、MCIc vs. NC 和 MCIc vs. MCInc 的 5 种指标结果,即准确率、AUC、召回率、精度和 f1 值及其对应的标准差如表 5 所示。

为了和其他方法进行公平比较,选择了实验所用的训练集和测试集数据与本文相同的文献[8,14],并做了多组对比试验。其他文献虽使用了 ADNI 数据库的数据,但具体挑选的数据集并不一样,同时 MCI 的划分也存在不同,因此,较难直接进行精确比较。于是,本文选择了在不同样本中分类效果比较好的文献方法进行了大致比较。例如,有些实验把 MCI 划分为进展型 MCI(progressive MCI,pMCI)和稳定型 MCI(stable MCI,sMCI),这在某种程度上与本文的 MCIc 以及 MCInc 相对应。表 6 给出了各方法的实验分类准确率和样本数量。Yang 等[24]通过独立主成分分析(independent components analysis,ICA)提取图像特征,然后将提取到的特征用 SVM 进行训练,最终实现 AD 的预测。文献[25]把 Bagging 和 SVM 相结合实现 AD/NC 的分类。李书通等[26]提出了一种基于非监督学习的 3D-PCANet 方法,实现了 AD 辅助诊断。文献[2]基于堆栈自编码器对 AD 进行分类。文献[10]通过提取图像局部密度特征,并结合图的示例学习技术完成了对 AD 的分类。

本方法的 3DCNN 网络的参数量总共为 31 610 258,单个 ROI 模型训练需要 0.78 h,大小为 361.83 MB,一个 ROI 基分类器的五折交叉验证模型则耗费 3.9 h 左右,总共 246 个脑区,因此,完成一组分类实验将花费 959.4 h,合计约 40 天,最终完成整个实验训练约需耗费 120 天左右。尽管从训练周期来看,时间成本巨大,但从实验结果来看,分类准确率显著提高。此外,经 GA 算法挑选后,在验证集上取得最高 f1 值的 ROI 脑区通过 BrainNet Viewer[27]进行三维可视化,如图 6 所示。

3.2 行为域值统计结果
本实验根据 Brainnetome Atlas 官网的各脑区行为域数据,对上述脑区统计出 AD vs. NC、MCIc vs. NC 和 MCIc vs. MCInc 各显著脑区的相关行为域数据,然后分别分析出各组实验中根据 GA 算法挑选的较显著的脑区 ROI 区域主要影响哪些行为,每组实验统计结果是取每个脑区行为域值最高的前三项(例如,R.mAmyg 脑区行为域域值最高的前三项分别为:Emotion.anger 域值为 5.02,Emotion.sadness 域值为 8.78,Emotion.disgust 域值为 7.87),然后对相同行为域对应的域值进行累加,最终得到如图 7 所示的统计图。

4 讨论与总结
本文提出了基于脑区 ROI 的 3DCNN 和 GA 结合 AD 早期辅助诊断集成模型。模型中的每个基分类器是每个 ROI 图像用 3DCNN 模型训练出来的,然后对这些基分类器按 f1 值进行排序筛选,这比 Aderghal 等[28]使用先验知识只选取海马体的图像训练 CNN 模型更为合理。实验所有 sMRI 影像均来自 ADNI 数据库,在与文献[8,14]使用的数据完全相同的情况下做了多组对比实验,来检验模型的有效性。由表 5、表 6 实验结果可知,本模型具有以下特点:
(1)仅对被试全脑影像进行训练的前提下,单纯 3DCNN 的 AD vs. NC 和 MCIc vs. NC 实验准确率比文献[8]的 PCA+SVM 以及文献[14]的 2DCNN 均有提高,表明本文 3DCNN 模型在特征提取方面具有一定优势。
(2)在提取 ROI 的前提下,3DCNN+Ensemble 和 3DCNN+GA 的实验结果明显高于单纯使用全脑影像的方法和 2DCNN 方法,一方面说明对图像提取 ROI 特征处理后,减少了其他无关特征的干扰,另一方面通过集成学习将挑选出的各个优秀基分类器集成起来共同对整个 MRI 的类别进行分类,使得最终的集成模型比单个全脑 CNN 基分类器具有更高的分类准确率和稳定性。
(3)集成模型 3DCNN+GA 比 3DCNN+Ensemble 和 2DCNN+Ensemble 效果更好,表明优化算法选出不同被试组中差异最大的 ROI 组合可以摆脱已有经验的束缚,充分利用 sMRI 的空间信息,从而相比于文献[14]简单排序投票集成,GA 算法在特征组合上更具优势,实验结果也证明了这一点。在 3DCNN+GA 方法中,AD vs. NC 的准确率为 88.6%,f1 值为 88.3%,GA 筛选的关键脑区除了左延髓海马、左尾部海马和内外侧杏仁核、左海马旁回,还新发现了了右颞中回前颞上沟、右扣带回背侧 23 等区域;MCIc vs. NC 的准确率为 88.1%,f1 值为 86.5%,GA 筛选的脑区除了右延髓海马、右尾部海马和内外侧杏仁核、左海马旁回,还新发现了了左梭状回延髓 20 等区域;MCIc vs. MCInc 的准确率为 71.3%,f1 值为 69.4%,GA 筛选的脑区为延髓海马、内外侧杏仁核、左梭状回、右扣带回背侧 23 和楔前叶背内侧枕壁沟等区域。
(4)此外,本文还对所有选出脑区的行为域值进行了分析,如图 7 所示,发现这些分类特征显著的脑区主要与情感、记忆、语言等功能相关,这与 AD 患者感情淡漠、失忆、丧失语言能力、丧失行动能力等临床表现基本一致。这进一步印证了 GA 算法所选 ROI 脑区的正确性和有效性,也表明了本研究所得到的脑区与 AD 具有较强的关联性。
当然,该方法也存在一定的局限性。例如,文献[12]认为,所有患病人群脑功能发生异常不总是发生在相同的所选 ROI 脑区,因此,固定相同的脑区可能会导致丢失用以区分患者的关键信息。这不利于更好地区分患病人群。而且,选择不同的脑区模板可能也会对分类结果有影响。另外,该模型在提高分类性能的同时,增加了训练时长。但是,一方面本研究结果在提高了 AD 诊断率的同时,还为 AD 早期诊断有帮助的脑区的有效判定提供了新思路;另一方面,sMRI 影像对脑萎缩、脑血管疾病和肿瘤等疾病的结构变化尤为灵敏[29],因此,这种方式不只局限于 AD 的辅助诊断,还可用于脑血管疾病和肿瘤等其他大脑疾病。这些将是下一步研究的方向。
利益冲突声明:本文全体作者均声明不存在利益冲突。