Automatic Scoring of Multiple Semantic Attributes With Multi-Task Feature Leverage: A Study on Pu...
原文连接:https://ieeexplore.ieee.org/document/7745891/citations
摘要
计算机和语义特征之间的间隙是制约临床应用计算机辅助诊断性能的主要因素之一。为了架起这座桥梁,我们开发了三个多任务学习方法(MLT):利用堆叠去噪自编码器和卷积神经网络的深度学习模型衍生的异构计算特征,手工生成的Haar-like和HOG特征,CT图像中肺结节的9个语义特征描述符。我们认为“细刺状”、“纹理”和“边缘”等语义特征之间可能存在一定的关系,可以使用MTL进行探索。LIDC数据集具有丰富的标注信息,很适合这项研究。实验结果表明,与单任务的LASSO和可伸缩网络的回归方法相比,三种MTL方案的预测语义评分更接近于放射科医生的评分。
9个语义特征
方法流程图
需要解决的新问题
新CAD问题面临很大的挑战,可以主要概括为三个方面:
为了解决三个问题,提出了利用多任务学习框架的方法:
尽可能多的计算异构特征。使用SDAE提取一般特征(不需要标签),使用CNN提取针对性强的特征,将这些特征和低级的Harr和HOG特征结合在一起。同时利用MTL进一步探索9个语义特征之间的关系。为避开切片厚度的变化,实现了基于切片的方案,也就是回归模型的训练是用二维切片ROIs 单元进行的,测试阶段通过平均来自组合式切片ROIs的分数来获得肺结节的最终评分。
贡献
该论文的贡献可以概括为三个方面:
方法
使用神经元生成特征
堆叠自编码器(SAE)是一种深度学习模型,通过非监督和监督训练两个阶段来实现。在无监督训练阶段,SAE体系结构是堆叠一个由一个输入层和一个隐藏层组成的两层自编码器来构建的。自编码器由编码器和解码器两部分组成,可以通过寻找合适的编码器和解码器啦实现重构误差的最小化。在没有数据标签的情况下,进行无监督的SDAE训练,因此,其提取的特征对所有语义特征具有通用性。
CNN模型的训练通常是在监督下进行的。针对9个语义特征使用了9个CNN模型,获得了针对于特定任务的计算特征。对于每一个CNN,将每个语义描述作为一个单独的类,作为分类问题进行训练。
手动生成特征
通过简单的逐块计算来表征低级图像的外观和上下文信息。结节的外观和纹理线索可以通过单块和成对块的Haar-like特征量化。
HOG使用局部方向梯度直方图描述感兴趣对象形状的一种低级描述符。HOG特征可以用来帮助描述几个形状语义特征。
总结
为了得到计算机术语和医学语义特征的映射关系。使用CNN、SDEA、Haar-like和HOG产生一个异构特征集合,针对医生评分得到的9个语义特征,使用多任务线性回归和随机森林回归产生特征和特定语义之间的最佳映射关系。
总结
以上是生活随笔为你收集整理的Automatic Scoring of Multiple Semantic Attributes With Multi-Task Feature Leverage: A Study on Pu...的全部内容,希望文章能够帮你解决所遇到的问题。
- 上一篇: 1.5 18:鸡尾酒疗法
- 下一篇: db2 load 快速_使用 DB2 的