基于卷积神经网络的肺癌病理图像分类
0 引言
肺癌是男性最常见的癌症致死病因,及早发现和确诊对于病人身体健康至关重要。胸部影像学检查如电脑断层(CT)等能提供初步检查和评估,但是只能作为诊断参考,肺癌的确诊以及肺癌子类型的确定必须由病理医师在显微镜下观察活体组织样本特征才能得到结果[1]。肺癌可粗分为小细胞癌和非小细胞癌,其中非小细胞癌主要有鳞癌和腺癌[2-3]。确定病人肺癌子类型对于后续治疗策略选择和预测治疗相当重要[4]。然而,对于样本中表现最好的特征病理,医师也难以得到很好的一致性诊断结果[4]。对于确定非小细胞癌和区分其子类型,腺癌和鳞癌的诊断一致性也相对较低[5]。诊断一致性与肿瘤区分度、活体组织切片质量相关。对病理图像主观或错误的诊断可能误选对应的治疗方案,从而降低病人存活率和生活质量[6]。
近年来,一些学者着力于对肺癌诊断预测定义额外的视觉特征[7]。数字病理学的出现使病理学得到了跳跃式发展[8]:虚拟显微镜传送技术能够将活体组织玻璃切片输出为能够在计算机上进行观察、分析的数字图像,数字病理学被称为能为癌症和其它重症疾病诊断、预后提供更好、更快、更廉价的最有潜力的实现方向之一[9]。Hipp[10]提出数字图像处理技术能够提高病理图像评估效率、准确率和一致性,能够为诊断结果提供决策支持。Yu等[11]通过在非小细胞癌数字病理切片图像中提取形态学特征并训练分类器分类非小细胞癌的亚型,从而预测患者生存期。
传统图像分类方法主要利用图像颜色、纹理和形状及手工设计的特征描述算子从图像中获取的Harris角点、SURF特征、SIFT特征等[12],且需要单独设计分类器。人工筛选特征的方法需要对特定任务有足够知识背景,并通过不断实验对参数进行调节,精力耗费大。
上世纪90年代,反向传播算法的出现使神经网络在人工智能领域引起了一次技术变革[13]。随着计算机处理能力不断提升,神经网络模型参数训练缓慢的问题得到解决[14],使其成为机器学习领域最受欢迎的主题。神经网络不同结构的模型解决了计算机科学领域的不同问题,在计算机视觉、语音识别、自然语音处理等领域取得了较好的识别结果[15]。卷积神经网络作为神经网络的一种变形,是各种网络结构中最重要的形式之一[16],通过局部连接和共享权重的方式获取图像丰富的特征,大幅提升了图像分类与检测能力[17],在图像处理领域得到广泛应用。对于亿兆像素的病理全切片图像,本文使用卷积神经网络模型训练基于块的分类器,测试阶段则通过聚合图像中块的分类结果得到最终结果。
1 分类模型与方法
1.1 深度学习框架选择
Keras是一个利用Python编写的开源神经网络库,可以以 Tensorflow、Theano或 MXNet为后端,提供一个更高层次、更直观的深度学习抽象集合,专注于用户友好、模块化和可扩展性,使用户能快速在各种计算后端开发深度学习模型。考虑实验模型构建的快速性与便捷性,本文选择使用Keras框架进行卷积神经网络模型构建。
1.2 卷积神经网络结构设计
卷积神经网络通过局部感受域和共享权重解决传统前馈网络中参数过多的问题[14]。卷积操作能够学习图像中的局部特征,特别适用于图像识别任务。基于卷积神经网络的分类模型能够自动学习训练样本图像中的特征表达,将传统图像识别任务中的特征提取与分类识别合二为一,进行端到端的图像处理,得到分类结果,避免重新训练
损失函数优化方法为 RMSProp,相对于 AdaGrad[19]方法,RMSProp通过加权平均的方法在训练过程中使学习率随着训练epoch增加自动衰减,解决了多层网络中学习过早结束的问题。相比于AdaGrad中的梯度累积量r←r+g⊙g,RMSProp优化器中引入衰减速率 ρ,加权计算历史梯度,累积量为r←ρr+(1-ρ)g⊙g。卷积神经网络总体结构如图1所示。基于图像特征的分类器。
对于输入图像,卷积网络的局部感受域(通常为3×3或5×5的区域)在图像上进行卷积操作构建隐藏层,每个连接学习一个权重和一个总偏置。同时,可以选择多个卷积核学习图像的不同特征。前面卷积层学习的特征为局部特征,最后卷积层可学习图像全局特征。本文实验卷积核大小为3×3区域,卷积核个数随网络层数加深,由32增至64。为避免Sigmoid激活函数梯度饱和及非0输出问题,并加快收敛速度,实验选用 Relu 激活函数[18],如式(1)所示。在卷积层之后通过池化层获取凝缩的特征映射,对于多个特征映射,混合层与其一一对应,本文实验以2×2的区域进行最大值池化。