肿瘤成像AI临床应用与挑战澎湃在线 - 前列腺结核

TUhjnbcbe - 2024/10/31 16:40:00

原创赵喜同学XI区

作为医学的核心原则之一，判断（Judgement）依赖于多层数据与微妙决策的整合。癌症为医疗决策提供了独特的背景（context），不仅要考虑疾病演变的多样化形式，还需要考虑患者的个体状况，接受治疗的能力以及对治疗的反应。尽管技术有所改进，但癌症的准确检测，表征和监测仍面临挑战。疾病的影像学评估通常依赖于视觉评估，其解释可以通过高级计算分析来增强。人工智能（AI）有望在临床医生对癌症成像的定性解释方面取得重大进展，包括随时间推移肿瘤的体积描绘，从其影像学表型推断肿瘤基因型和生物学过程，预测临床结果，并评估疾病和治疗对邻近器官的影响。AI可以将图像的初始解释过程自动化，并将影像学检查的临床工作流程，是否进行干预的管理决策以及随后的观察转变为尚未设想的典范。来自哈佛医学院的学者回顾了AI应用于肿瘤成像的现状，并描述了4种肿瘤类型（肺癌，中枢神经系统肿瘤，乳腺癌和前列腺癌）的进展，以说明如何解决常见的临床问题。尽管迄今为止评估AI在肿瘤学中的应用的大多数研究尚未得到有力的可重复性和普遍性验证，但结果确实突出了推动AI技术临床应用和影响癌症治疗未来方向的日益协同的努力。今天我们一块学习一下这篇刊登在神刊CA（IF：）的文章。

癌症作为一种自我维持和适应性过程，与其微环境动态相互作用，尽管在理解其生物学基础方面取得了重大进展，但仍继续阻碍着患者，研究人员和临床医生。鉴于这种复杂性，在癌症治疗的每个阶段都会出现困境，包括可靠的早期发现；肿瘤前和肿瘤病变的准确区分；手术治疗期间浸润性肿瘤边缘的确定；跟踪肿瘤的演变以及随着时间的推移对治疗的潜在获得性耐药性；以及肿瘤侵袭性，转移模式和复发。医学成像和微创生物标志物的技术进步有望解决癌症检测，治疗和监测领域的这些挑战。然而，对这些技术进步产生的大量数据的解释提出了新的潜在挑战。

随着我们对疾病本身的了解越来越多，我们正在更多地了解我们已经可用工具的功能，这些工具可以以前所未有的方式使用。当最初检测到肿瘤病变时，需要将其与非肿瘤的相似病变区分开来，并根据其预测的临床过程和生物侵袭性进行分类，以优化治疗的类型和强度。CT和MRI的广泛应用促进了对体内病变的偶然检测，其临床意义尚不清楚，然后启动了一系列观察，进一步测试或经验干预。通过包括通过手术进行细胞减灭，通过放疗引发肿瘤损伤的直接和间接机制以及药物疗法在内的治疗，癌症可以适应施加，发展和复发的压力。随着治疗后体积增大的病变的影像学外观，必须区分肿瘤或组织对损伤的反应。复发时，已显示肿瘤性病变具有不同于原发性肿瘤的新分子畸变，这可能赋予对医学或放射疗法的抵抗。初始诊断时肿瘤固有的肿瘤内异质性使其更加复杂，研究越来越多地证明了这一点，但在常规临床病理学取样和分析中很难捕获。作为追踪治疗反应和提示肿瘤本身的关键信息的最常用方法，无创成像的需求从未如此之大。

传统的肿瘤影像学评估主要依赖于定性特征，例如肿瘤密度，增强模式，肿瘤内细胞和无细胞成分（包括血液，坏死和矿化的存在），肿瘤边缘的规律性，与周围组织的解剖关系，以及对这些结构产生的影响。可以在1,2,3维分析中量化基于尺寸和基于形状的肿瘤测量。这些定性的表型描述统称为“语义（semantic）”特征。相比之下，一个称为放射组学（radiomics）的快速发展的领域正在使影像学图像数字解码成定量特征，包括形状，大小，人工智能（AI）方法学的最新进展在自动量化医学成像数据中的影像特征方面取得了重大进展。深度学习是AI的一个子集，是一种特别有前途的方法，可以自动从样本图像中学习特征表示，并且已被证明在任务特定的应用程序中匹配甚至超越人类的表现。尽管需要大量数据集进行训练，但深度学习已经证明了对准确分类（groundtruth）标签中具有相对较强的抗噪声能力。AI的自动化功能提供了增强临床医生定性专业知识的潜力，包括随时间推移精确的肿瘤大小体积描绘，多个病变的平行跟踪，肿瘤内表型细微差别转化为基因型含义，通过将个体肿瘤交叉引用到潜在无限可比病例的数据库中进行结果预测。此外，深度学习方法有望在疾病和成像模式之间实现更大的普遍性，对噪声的鲁棒性以及减少错误，最终导致早期干预并显著改善诊断和临床护理。尽管这些研究仍主要处于临床前研究领域，但这种自动影像学“放射组学（radiomic）”生物标志物的持续发展可能会突出显示肿瘤在临床可操作性变化，并随着时间的推移推动肿瘤鉴别的范式转变。

在这一激动人心的技术转型开始时，我们回顾了应用于4种常见癌症类型（肺癌，脑癌，乳腺癌和前列腺癌）的医学成像的AI方法的当前证据和未来方向。我们描述了癌症检测和治疗中的临床问题和局限性，目前的方法如何试图解决这些问题，以及AI如何影响未来的方向。

AI在肿瘤成像中的应用

提高临床护理疗效和效率的愿望继续推动包括AI在内的多项创新。随着对医疗保健服务需求的不断增加以及并行数据流每天生成的大量数据，临床工作流程的优化和简化变得越来越重要。AI擅长识别图像中的复杂图案，因此提供了将图像解释从纯粹的定性和主观任务转换为可量化且毫不费力地重现的任务的机会。此外，AI可以量化来自人类无法检测到的图像的信息，从而补充临床决策。AI还可以将多个数据流聚合到强大的集成诊断系统中，涵盖医学影像，基因组学，病理学，电子健康记录和社交网络。

在肿瘤成像中，AI在执行3项主要临床任务方面具有很大的实用性：肿瘤的检测，表征和监测（图1）。检测是指在医学影像图像中感兴趣的对象的定位，统称为计算机辅助检测（CADe）。基于AI的检测工具可用于减少观测疏忽，并作为初始评估时防止遗漏错误的工具。在模式识别环境中制定公式，突出显示具有可疑成像特征的区域并将其呈现给读者。CADe已被用作辅助助手，用于在低剂量CT筛查中识别遗漏的肿瘤，检测MRI中的脑转移瘤以改善影像学解释时间，同时保持高检测灵敏度，在筛查乳腺X线照相术中定位微钙化簇作为早期乳腺癌的指标，并且更普遍地已经改善放射科医师检测异常的敏感性。

图1人工智能在医学成像中的应用。AI工具可以概念化应用于肿瘤学中3大类基于图像的临床任务：1）异常检测；2）通过定义可疑病变的形状或体积、组织病理学诊断、疾病阶段或分子特征来描述病变特征；3）确定预后或对疾病的反应监测期间随时间变化的治疗。

特征描述广泛地反映了肿瘤的分割、诊断和分期。它还可以扩展到包括基于特定疾病的预测以及基于特定治疗模式的结果预测。分割定义了异常的程度。这可以从平面内肿瘤最大直径的基本二维测量，到更复杂的体积分割，其中评估整个肿瘤和可能的周围组织。这些信息可用于随后的诊断任务以及辐射规划期间的剂量管理计算。在目前的临床实践中，肿瘤通常是手工定义的，与之相关的局限性包括研究者之间的偏差，甚至专家之间也有不一致的再现性，以及时间成本和劳动的消耗。虽然手动跟踪分割经常被用作判断自动分割算法准确性的基础，但它有可能忽略亚临床疾病，并将分析区域限制为人类偏见。人工智能有可能通过自动分割显著提高肿瘤测量的效率、重复性和质量。最后，随着计算速度的快速扩展和人工智能算法效率的提高，未来的肿瘤病灶分析可能不需要单独的分割步骤，全身成像数据可以直接由人工智能算法进行评估。全身法还可以分析可能是病理性但对人类视觉不明显的器官结构。

根据影像学数据，随后诊断为良性或恶性可疑病变最终导致放射科医生的视觉解释。临床上，人类的经验和专业知识是用来解决这类问题的主观，定性特征。相比之下，计算机辅助诊断（CADx）系统使用定量肿瘤特征的系统化处理，允许更多可重复的描述。CADx系统已被用于在薄层CT中诊断肺结节以及在多参数MRI中诊断前列腺病变，其中在人类读者之间观察到解释上的不一致。特征还包括分期，根据肿瘤外观和扩散的差异，将肿瘤分为预先确定的组，这对预期的临床进程和治疗策略是有用的。最广泛使用的癌症分期系统是TNM分类，其他方案适用于特定器官，如中枢神经系统（CNS）。最近的研究通过评估乳腺MRI中的肿瘤范围和多灶性，扩展了进行分期的系统，而其他研究则开发了对比增强磁共振乳腺成像（MRM）中的自动病灶体积测量工具。

另一个层次的特征是询问肿瘤的生物学特征。“影像基因组学（imaginggenomics）”的新兴领域将放射成像特征与生物数据相关联，包括体细胞突变、基因表达、染色体拷贝数或其他分子特征。从数据的角度来看，基因组学分析的成熟为基于人工智能的影像工作提供了协同的机会。

最后，在自然病程或对治疗的反应中，AI在监测肿瘤随时间的变化中起着越来越重要的作用。传统的肿瘤时间监测通常局限于预定义的指标，包括通过实体瘤疗效评估标准（RECIST）和世界卫生组织（WHO）的肿瘤负荷评估和治疗疗效评估标准测量的肿瘤最长直径。除了被批评为过于简化通过复杂的成像仪器捕获的复杂肿瘤的几何形状外，还对此类标准的普遍性和有效性提出了质疑，例如在骨性病变的情况下，并未导致化疗（已证明可改善生存率）由RECIST测量的影像学反应。然而，基于人工智能的监控能够在一段时间内捕捉到大量不同于人类读者测量的图像特征。尽管计算机辅助监测的看似不同的组成部分是研究的活跃领域（计算机辅助时间图像的配准、分割和诊断），但该领域仍处于起步阶段，应用尚未浮出水面。

除了成像，其他微创生物标志物也正在开发用于肿瘤诊断和疾病的纵向追踪。最值得注意的是，液体活检或对肿瘤细胞释放的循环肿瘤DNA（ctDNA）的分析，提供了一个了解肿瘤当前和动态状态的窗口，并允许跟踪疾病进展或消退，以及近实时监测靶向或耐药相关癌症突变的出现。因此，液体活检与放射组学分析相结合，可以通过对肿瘤生物学的无创性描述来显著改善肿瘤治疗，从而更准确地评估预后和实时疾病监测，从而达到精确医学的目的。

在医疗机构内，上述人工智能干预措施预计将增强其各自当前的标准护理对应措施（图2）。除了为临床医生提供辅助信息外，多项工作还证明了人工智能在工作流程的临床决策阶段的实用性。通过基于人工智能的综合诊断，将分子和病理信息与基于图像的发现相结合，将为发现增加丰富的智能层次，最终导致更明智的决策。

图2AI干预可能增强临床工作流程。肿瘤患者的传统模式需要对肿块病变进行初步影像学诊断，根据临床因素和患者偏好决定治疗或观察，只有在获得组织后才进行明确的组织病理学诊断，在有此类资源的中心进行分子分型，并仅确定临床结果且在一段时间之后。相反，基于人工智能的干预提供了在肿瘤治疗的不同阶段增强临床工作流程和决策的可能性。测量结果的持续反馈和优化可以进一步改善人工智能系统。

肺癌影像

肺癌是全球癌症相关死亡的主要原因。尽管在过去的几十年中，大多数癌症类型的生存率都有所提高，但肺癌仍落后，这主要是因为肺癌往往进展得很快，到被发现时，治疗选择有限。研究发现，大多数被诊断为肺癌的患者会由于诊断不及时而死亡。医学影像学和人工智能有望在提高肺癌良恶性结节的早期诊断和定性方面发挥重要作用。因为早期阶段通常是可以治愈的，这可以极大地改善患者的预后，减少过度治疗，甚至挽救生命。此外，AI还可以提高肺癌的分期和治疗选择的特征，以及监测治疗反应（表11）。

表1人工智能在肺癌影像学中的作用，应用于肺癌的检测、诊断、定性、预测预后和治疗反应的关键研究综述

AI在肺癌筛查中的临床应用

直到最近，即使在高危人群中，检测早期肺癌的方法也难以找到。NLST表明，低剂量CT（LDCT）筛查可将目前和以前吸烟的高危人群的总体死亡率显着降低20％。早期发现的肺癌，无论是通过LDCT筛查还是偶然发现，与出现临床症状时检测到的肺癌相比，更适合手术治愈和改善生存结果。尽管免疫检查点抑制剂和靶向治疗的出现已经证明在亚组患者中持久的长期存活，但并非所有患者都受益于这种治疗方式；因此，早期发现具有改善患者存活的益处并且可能限制对广泛治疗的需要。根据这些NSLT研究结果，现在建议对高危人群进行年度LDCT，并且仅次于一级预防（戒烟）以减轻肺癌死亡率，特别是对于戒烟但仍处于危险中的人群。尽管NLST显示出降低全因死亡率的明显益处，但许多限制与肺癌的早期发现相关，这可以通过先进的计算分析来增强。在下面的章节中，我们将描述肺癌筛查中的当前问题和局限性，常规方法如何试图克服这些局限性，以及AI如何改善这些领域。

肺癌筛查经常发现大量不确定的肺结节，其中只有一小部分被诊断为癌症（图3）。在NLST中，LDCT筛查中发现的96.4%的肺结节未发生癌变。目前，还没有确定的方法来分类这些结节是恶性还是良性。肺癌筛查的另一个潜在危害是对缓慢生长的惰性癌症的过度诊断，这些结节即使不及时治疗可能也不会构成威胁。因此，必须认识到，识别和显著减少过度诊断。接下来，如果检测到结节，临床指南提供结节的评估和随访，但不提鉴别供诊断的决策工具，并预测风险和未来癌症发展的可能性。虽然传统的生物统计学和机器学习方法已被用于解决肺癌筛查中的许多局限性，但AI有可能取代这些方法来识别减少成像假阳性结果并更准确地区分良性和恶性结节。这可以导致对肺癌风险和发病率的更定量预测，从而产生稳健，更好定义的临床决策指南。

图3人工智能在肺癌筛查中的临床应用。影像学分析显示，在最初发现偶发性肺结节和鉴别惰性和侵袭性肺肿瘤时，有希望预测肺癌的发生风险。

大多数不确定的肺结节是偶然发现的，这给患者及其提供者带来了困境。每年，超过万美国人被诊断为偶然发现的结节；而这些结节大多是良性肉芽肿，约12%可能是恶性的。Fleischner协会和美国放射学会肺CT筛查报告和数据系统（Lung-RADS）为这些偶然发现的结节的随访和管理提供了建议，通常需要在3到13个月之间进行随访成像，以确认生长情况，然后再进行更具侵入性的诊断（如活检）。这些系统是“语义（semantic）”的，因为它们描述了影像学词典中常用的特征，用于描述人类专家感兴趣的区域。因为它们是手工评分的，所以很有可能出现较大的读者间差异。在最近的一项研究中，一个包含4个定量评分的语义特征（短轴直径、轮廓、凹陷和纹理）的模型在肺癌筛查中用于区分良恶性结节的准确率为74.3%。另一项研究是为了识别小肺结节（小于6mm）的语义特征，以预测肺癌筛查环境中的肺癌发病率，根据肺气肿总分、血管附着、结节位置、边界定义和凹陷，最终模型显示的受试者操作特征曲线下面积为0.。尽管在上述分析中恶性结节和良性结节之间存在不平衡，但这些研究为语义特征在肺癌筛查中的应用提供了有力的证据。与肺癌筛查中发现的结节一样，偶发性肺结节的护理标准缺乏准确的决策工具来预测恶性与良性疾病以及惰性与侵袭性行为。因此，对偶发性肺结节的适当处理取决于癌症的可能性及其行为的潜在侵袭性。对结节性质的预测可以证明截然相反的策略，例如活检和观察。错误的预测会带来严重的后果，一方面是延迟干预导致过早死亡的风险，另一方面是侵入性检测导致的发病率和死亡率。肺癌筛查也能检测出表现出广泛行为的肿瘤：有些在临床上是惰性的，有些则具有攻击性，需要及时治疗。一项研究估计，超过18%的肺癌在NLST的LDCT检测似乎是惰性的。

年，Arnold基金会为自动肺癌检测和诊断挑战赛提供了万美元的资助。在这项挑战中，国家癌症研究所（NCI）癌症影像档案馆的数千张带注释的CT图像被提供给社区，以训练和验证他们的模型。所有顶尖团队都使用卷积神经网络（CNNs）来自动检测和诊断病变，获奖者必须公开他们的网络模型。获胜的团队报告了一个很高的性能（logloss=0.；其中一个完美的模型的logloss为0）。尽管这是令人鼓舞的，但值得注意的是，获胜的网络需要对其在临床环境中的表现进行更详细的评估。此外，有一个显著的偏倚，在这个挑战中50%的癌症患病率，这显著高于筛查人群与不确定结节患者中4%的患病率。尽管这一挑战确定了有前途的方法，但在它们能够用于临床之前，很可能需要进行重大的调整。

尽管在美国和大多数西方国家，肺癌的发病率正在下降，但肺癌在未来几十年仍将是一个主要的公共卫生负担。即使戒烟后，既往吸烟者患肺癌的风险仍然增加，特别是与终生不吸烟者相比。因此，肺癌筛查的改进对于改善患者的预后仍具有重要意义。随着肺癌影像学研究从传统的生物统计学，到机器学习，再到深度学习，我们认为人工智能可能成为下一个发展临床上可采用的方法，精确识别风险，提高对未来癌症发病率的风险预测，区分恶性和非恶性结节，区分惰性肿瘤和侵袭性肿瘤。

肺癌的影像学特征

肺癌表现出广泛的行为，有些是临床惰性的，有些是侵袭性的，需要及时治疗。尽管有预后因素与较好的生存率相关（如女性、表皮生长因子受体[EGFR]突变的肿瘤、早期疾病、无区域淋巴结受累和良好的表现状态），也有与较差的生存率相关的因素（如肺功能差，心血管疾病、男性、当前吸烟状况、高龄和晚期肿瘤）的存在，这些因素限制了将癌症作为“移动目标（movingtarget）”的异质性、动态性加以解决的临床实用性。具体而言，肿瘤病变是不断演变和多样化的，改变其表型和基因组组成，通过转移扩散，甚至改变其位置。当受到治疗干预的选择压力时，这一点更为真实，在治疗干预中，癌症进化迅速探索和利用耐药机制，甚至有可能借助全身细胞毒性化疗的诱变性质，使治疗肿瘤的医生追逐一种不断变化的疾病。

相反，基于图像的生物标志物可以无创性和纵向地捕捉影像学表型，并描述肿瘤的潜在病理生理学特征。由于易于临床实施，基于大小的测量方法，如肿瘤的最长直径（如RECIST和WHO）被广泛用于分期和疗效评估。然而，基于大小的特征和疾病阶段具有局限性，因为这些指标与结果和反应的显著可变性相关。因此，识别语义特征和自动放射特征预测肺癌患者预后的研究工作已经取得了成功。例如，CANARY工具（计算机辅助结节评估和风险收益率）提供了基于语义的风险分层，以确定肺腺癌中一个潜在的易受攻击的亚组，该亚组的病程更为严重。初步研究表明，AI可以自动量化肿瘤表型的影像学特征，并且该信息对包括肺癌在内的多种癌症类型具有显著的预后（P3.?6）；此外，AI还与肺腺癌（P=1.?17）的远处转移相关组织学亚型（P=2.-7），以及潜在的生物学模式（包括体细胞突变和基因表达谱）有关。

医学影像学评价肿瘤内异质性

医学影像学在量化肺癌的瘤内特征方面也能发挥重要作用。对来自同一肿瘤的多个独立样本的测序研究表明，肿瘤内异质性（ITH）是实体肿瘤的一个共同特征。肿瘤由数十亿个独立的癌细胞组成。低水平的DNA损伤或表观遗传调控的改变在每一个细胞分裂中被引入，引起癌细胞基因组的轻微变化，并随着时间的推移而增加。当一个变化在特定的微环境中诱导了一种选择性优势时，克隆扩增可以产生一个癌亚克隆，所有癌细胞共享一个单一的、最近的、共同的祖先。非小细胞肺癌（NSCLC）和透明细胞肾癌的预后不良与基因组ITH有关，ITH是指同一肿瘤内独立的癌细胞亚克隆共存。然而，肿瘤亚克隆可能在空间上是分离的，并且可以携带显著不同的突变负荷，范围从高度同质到超过个异质突变，在同一肿瘤的不同区域之间存在差异。

ITH分析表明，尽管在单个肿瘤活检中靶向性体细胞改变可能是克隆性的，但在同一肿瘤不同部位的其他活检中可能完全没有。肿瘤内存在表型多样化的证据对基于单区域活检组织分子特征的精确医学技术的应用产生了影响。因为在单个肿瘤活检中确定的靶点可能是亚克隆的，针对它们的治疗只能对一部分癌细胞有效，没有靶点的癌亚克隆不受损害（图4）。在临床上，人们提出了不同的策略来量化ITH，包括原发性肿瘤的多区域测序、循环肿瘤DNA分析和医学成像数据的使用。不幸的是，尽管与单样本分析相比，多区域测序提供了改进的ITH范围测量方法，但它需要足够大的高质量肿瘤样本，并且仍然存在潜在的取样偏差，由于肿瘤的整体取样不完整，有可能错过重要的肿瘤亚克隆。

图4无创监测在肿瘤演变过程中的应用。癌症有一个共同的主题，即在自然病史中发展肿瘤内异质性。亚克隆的存在（以不同的颜色表示）对治疗的反应具有重要意义，可能很难通过标准活检获得。疾病监测期间的成像和血液生物标记物为检测肿瘤内异质性的存在提供了一种潜在的技术解决方案，从而可能直接改变治疗策略。

医学影像学在定量研究肺癌的瘤内特征、提高肿瘤的捕获和定量诊断能力方面发挥着重要作用。此外，由于进化适应度是上下文关系，并且取决于特定的微环境，因此这些环境很可能可以通过成像来识别。与大多数基于肿瘤的生物标记物类似，存在许多局限性，因为肿瘤的异质性和肿瘤标本对生物标志物检测的要求，它们可能会受到取样偏差的主观影响，并且分析通常可能是及时的、昂贵的，并且需要大量的组织或组织分析物。相比之下，基于图像的特征在人工智能的指导下，可从标准护理图像中实时获得，不需要及时（且通常昂贵）的实验室分析测试，不受采样偏差和伪影的影响，并且是非侵入性的。基于图像的特征代表了整个肿瘤的三维表型，而不仅仅是接受生物标记物检测的部分（即活检）。

AI用于评估靶向治疗和免疫治疗的反应

基于RECIST标准的定量成像终点的成功为肿瘤学人工智能的发展铺平了道路，因为在临床试验中广泛采用这些终点作为早期生存指标，产生了大量具有临床元数据的CT图像数据集。对这些临床试验数据集的回顾性分析在满足人工智能对大数据的需求方面是非常宝贵的，以支持人工智能算法的培训和验证，否则可能会被从头开始生成这些数据集所需的费用和努力所禁止。部分原因是RECIST的成功，定量CT分析现在是当代肿瘤学的主力，为人工智能预测模型创造了即时的转化潜力。

人工智能的优势非常适合于克服当前一代靶向和免疫疗法带来的挑战，这些疗法可以产生明显的临床益处，而基于RECIST的终点很难捕捉到这些益处。这些终点依赖于这样的假设，即治疗的成功反应将通过肿瘤缩小来反映，特别是基于肿瘤直径的反应测量假设肿瘤是球形的，并且在治疗后经历均匀的空间变化。靶向治疗和免疫治疗导致了新的反应模式，这些新的反应模式混淆了当前基于RECIST的终点，并可能导致临床试验的高失败率和药物开发的成本。因此，AI量化与反应相关的生物学过程而不是大小的能力满足了该领域的迫切需求。

目前，靶向治疗和免疫治疗的反应预测是基于免疫原性肿瘤微环境（例如，程序性细胞死亡配体1[PD-L1]表达）和突变状态（例如，EGFR）的生物标记物。这些都是通过活检获得的，这是侵入性的，难以纵向执行，并局限于一个单一的肿瘤区域。PD-L1表达的预测价值也可能有限。例如，在KEYNOTE‐临床试验中，无论PD‐L1表达如何，pembrolizumab联合标准化疗的免疫治疗对所有患者都产生了生存益处，即使在PD‐L1肿瘤比例得分低于1%（应表明获益的可能性很小）的患者中。

越来越多的证据表明，人工智能可以通过识别与免疫反应相关的影像生物标志物来评估免疫治疗的反应。影像学表型与抗PD1二线治疗后NSCLC患者的总生存率（OS）相关。在这项研究中，通过两个放射组学特征（区域差异性（危险比

，0.11；95%置信区间[95%CI]，0.03-0.46[P=.]）和熵（HR，0.20；95%CI，0.06-0.67[P=.]）对OS进行了显著预测（P=.），这表明原发性肺肿瘤在增强CT上具有不规则的强度模式。另一项肺癌研究表明，通过向临床模型中添加基因组学和放射组学信息，OS的预后得到改善，导致95%CI从0.65（NoetherP=0.）增加到0.73（P=?9），这些发现表明，放射组学和基因组学生物标记物是互补的，为人工智能阐明其组合数据之间的预测关联创造了潜在的作用。尽管机器学习已被用于基于微阵列基因表达模式的识别对肺癌进行基因分类，但其用于检测预测预后的放射组学-基因组学相关性的方法仍有待研究。

定量成像数据的人工智能分析也可能改善对靶向治疗反应的评估。使用抗血管内皮生长因子（VEGF）单克隆抗体贝伐单抗治疗的NSCLC肿瘤对氟脱氧葡萄糖的摄取减少，比常规CT标准确定更多的患者对治疗有反应（73%对18%）；在该研究中，正电子发射断层扫描（PET）和CT均与OS无关（PET,P=.;CT,P=.）。目前，预测靶向治疗的反应主要是通过活检来分析靶向突变的状态。人工智能预测模型可以通过识别与突变状态相关的成像表型来补充这一点。这种方法的优点是能够反复无创地描述所有肿瘤的突变状态，而不仅仅是在活检部位，这可以避免缺乏与肿瘤内异质性相关的预测能力，以及在、肿瘤内不同的转移中出现不同的获得性耐药机制。支持这一方法的是对接受吉非替尼治疗的非小细胞肺癌患者的定量影像学研究。这些结果表明，EGFR突变状态可以通过放射特征定律-能量（曲线下面积[AUC]=0.67；P=.03）显著预测。

生物标志物必须是客观的和可重复测量的，以作为反应评估的标准。人工智能通过其在肿瘤图像中描述复杂模式的能力提供了高度的客观性，而没有与人类专家视觉评估相关的观察者间的可变性。了解放射组学特征的测量误差对于建立基于这些特征的人工智能预测模型的可再现性具有重要意义。不同的肿瘤分割算法引入了已知会影响放射组学特征计算的方差，因此可能会影响AI技术的性能。成像设置，包括CT扫描仪、切片厚度和卷积核，也会影响放射组学特征的计算。这些设置的变化存在于临床实践和临床试验中，并可能影响AI开发的生物标记物的能力和再现性。CNNs的训练和验证可以通过选择可再现的预测特征并丢弃那些在不同图像集之间变化的特征来减少这种影响，但是这需要被证明。人工智能领域的快速发展与临床试验终点的需求之间也存在紧张关系，临床试验终点需要在标准更新之前（例如，从RECIST1.0到1.1）保持历史一致性并在大型数据库中实现验证。在公共领域癌症数据集的规模和适当性方面继续取得进展是满足后一种要求的必要条件。

中枢神经系统肿瘤影像

中枢神经系统肿瘤的病理学范围很广，可能比身体其他器官系统的肿瘤更为多样。在全身性肿瘤或脑实质转移瘤中占优势。此外，与大脑相邻的非神经组织引起的多种肿瘤是常见的，必须考虑在中枢神经系统肿瘤中，包括脑膜瘤、垂体瘤、神经鞘瘤和颅骨病变。这种多样化的诊断方法对临床医生提出了独特的要求，要求他们对影像进行准确评估。

目前在评价中枢神经系统肿瘤的放射学研究过程中存在三个主要挑战：1）准确诊断疾病的类型和程度等同于临床决策；2）随着时间的推移，肿瘤疾病的可靠跟踪，特别是在治疗后对周围神经组织的相关影响，随着分子分类学在影响肿瘤行为和临床结果方面的作用越来越受到重视，它可能获得难以与肿瘤区分的信号特征；以及3）从肿瘤的表型表现中提取基因型特征的能力。

肿瘤患者的传统模式需要对肿块病变进行最初的影像学诊断，根据临床因素和外科医生或患者的偏好决定治疗或观察，只有在获得组织后才进行最终的组织病理学诊断，在有这些资源的中心进行分子基因分型，以及只有经过一段时间才能确定临床结果（图2）。仅从影像学数据中准确推断病理学和基因组学数据，类似于影像基因组学领域正在开发的技术，将破坏这一经典范式，从而在更早的时候使用更全面的数据来改善对患者的指导。影像基因组学还可以阐明在人群中以及在不同人群之间进行的多机构临床试验中治疗成功和失败的原因。此外，在全球范围内，缺乏神经放射科医生，很少接触到罕见的中枢神经系统肿瘤，或者缺乏分子图谱的地方，通过共享网络算法对成像进行计算分析为改善所有脑瘤患者的护理提供了潜在的宝贵资源。

中枢神经系统的诊断困境

影像学在脑肿瘤的早期诊断中起着重要的作用，是早期和后续评估的常规部分。脑肿瘤复杂的影像学特征，以及肿瘤类型中频繁的遗传异质性和获得组织诊断所需的程序的侵袭性，导致了该领域的诊断难题（表2）。

表2关于人工智能在中枢神经系统肿瘤成像中的作用的关键研究综述，包括应用于诊断、生物学特性、监测治疗反应和预测预后

胶质瘤是成人最常见的恶性原发性脑肿瘤，CT和MRI等横断面成像技术可提供高分辨率的空间信息和组织对比度，使放射科医生能够描述不同的胶质瘤亚型和级别。人工智能可以提高目前标准诊断成像技术的实用性，它可以使神经胶质瘤的术前分类更加精确，超出人类专家所能提供的范围。例如，人工智能已应用于术前磁共振成像的研究中，以通过使用从空间共配准，多模式MRI获得的图像纹理特征训练机器学习分类器来区分低度和高度肿瘤以及各个WHO等级（表2）。此外，神经胶质瘤的临床相关分子亚型，如异柠檬酸脱氢酶（IDH）突变的存在，可以通过机器学习方法识别，包括在常规MR图像上训练的深层CNN。

然而，亚型分类问题并不是成人胶质瘤独有的。概念上类似的工作也在其他脑肿瘤上进行，其中已经证明，根据从常规MRI中提取的放射组学特征训练的分类算法可以生成垂体腺瘤亚型和儿童脑肿瘤的预测模型（表2）。

在区分不同的肿瘤类型时，也会出现诊断上的模糊性。一个关键的临床难题是如何区分原发性中枢神经系统淋巴瘤和胶质母细胞瘤，两者可能具有相似的影像学表型。放射组学模型，使用基于图像的纹理特征，已经被证明可以增强胶质母细胞瘤和原发性中枢神经系统淋巴瘤之间的差异。有趣的是，在评估这两种疾病过程的组织病理学切片时，常常会出现类似的诊断难题；随着CNN在全球研究中越来越多地应用于组织病理学图像分类，我们预计也会出现解决这一问题的稳健预测模型。

迄今为止，人工智能在脑肿瘤研究中的应用主要集中在区分脑肿瘤的组织病理学和分子亚型方面。为了实现这一点，人工智能算法使用预先选择的具有特定肿瘤亚型的患者群体进行训练。这种方法使得将诊断模型集成到临床工作流程中具有挑战性，因为只有当测试群体与训练数据相似时，模型的诊断精度才能保持一致。有了基于更一般患者群体的足够训练数据，AI的诊断能力很可能会扩展到包括多种肿瘤类型以及非肿瘤良性病变之间的准确鉴别。

肿瘤检测和描绘

与肿瘤亚型之间准确诊断鉴别的协同作用是计算算法自动检测肿瘤本身的存在和程度的能力。MRI是描述中枢神经系统肿瘤最常见的方式，在MRI上，肿瘤可能表现为不同程度的对比增强或完全无对比增强；可能与瘤周水肿或出血有关；并可能因邻近的骨骼，血管，脂肪或外科材料而使边缘模糊。此外，神经系统对治疗的反应，也被称为假进展，在区分肿瘤和非肿瘤方面增加了一层复杂性，如下所述。尽管这些特征对CNS肿瘤的自动检测提出了挑战，但仍然需要开发强大的体积算法来分析肿瘤及其邻近的微环境。

近年来，关于CNS肿瘤的半自动和自动检测的研究和方法层出不穷，主要应用于常规MR成像，也应用于PET和超声成像。尽管半自动算法在探索和研究中使用最为频繁，但其已被应用于立体定向放射外科的治疗计划、术后残余肿瘤体积的定量以及肿瘤生长的跟踪。强大，自动的肿瘤检测算法在评估具有众多颅内病变的患者（例如在CNS转移范围内及其生长速率差异或对治疗的反应）方面的优势。同样，在颅底病变中，其形状通常是不规则的，并跨越颅内和颅外隔室，自动容积重建可能会发现偶然的观察者忽略的敏感的生长变化。

一些研究人员几乎可以普遍使用用于图像分析的计算工具以及共享开源代码，这有望加快该领域的发展速度。此外，公开可用的成像数据库为假设检验和验证提供了强大的资源，包括来自医学图像计算和计算机辅助干预（MICCAI）组的多模式脑肿瘤图像分割挑战（BRaTS）数据，癌症成像档案和常春藤胶质母细胞瘤地图集项目。最终，这些努力的成果有望开发出工具，最大限度地减少观察者间随时间和治疗追踪肿瘤的变异性，并从CNS肿瘤的常规成像中提取超出放射照相表型的更深层数据。

治疗反应监测

在20%到30%的胶质母细胞瘤患者中，接受标准的、预先放射治疗并辅以替莫唑胺，观察到造影剂增强病变的扩大，这些病变在不改变治疗方案的治疗过程中稳定或消失，称为假性进展。类似地，大约25%的中枢神经系统转移瘤在照射野内发生坏死，表现为扩大强化，类似于脑转移瘤立体定向放射外科术后复发的肿瘤。尽管许多传统或先进的成像技术已经被研究来区分真实的肿瘤和治疗相关的改变，但是在空间上描述异质性组织仍然是一个挑战，这些异质性组织通常同时包含有存活的肿瘤和治疗相关的改变。使用机器学习方法组合多个成像特征可以提高构建准确组织分类器的能力，从而解释治疗肿瘤的异质性。从常规MRI中提取的纹理特征已被用来区分放射性坏死和复发性脑肿瘤。灌注加权和磁敏感加权MRI序列也可以结合起来区分高级别胶质瘤患者的复发和放射性坏死。纹理分析也已应用于氨基酸PET成像以诊断假性进展。为了提供肿瘤和坏死组织更直接的历史相关性，与立体定向活检部位共同配准的基于体素的MRI评估已经产生了与活检标本的细胞计数相关的参数模型。总体而言，这项研究大部分正处于临床试验中从试验数据转向验证的阶段。只有在更严格地证明此类技术的临床实用性后，才能实现监管批准和商业化，然后传播到广泛的临床应用中。

中枢神经系统肿瘤的生物学特征：前景和前景

对于最常见的中枢神经系统肿瘤，已经定义了一种分子分类法，具有广泛的应用范围，并降低了下一代测序的成本。此外，已经观察到分子特征赋予超出标准组织病理学分类的预后意义，包括成人和儿童神经胶质瘤，脑膜瘤，垂体瘤，颅咽管瘤，成神经管细胞瘤和室管膜瘤。这些分子印记越来越多地指导肿瘤监测成像的频率，临床结果和复发风险的患者咨询，以及决定治疗类型（例如放疗或观察）。然而，这些信息很大程度上仅取决于干预后肿瘤的组织取样。此外，与全身性癌症一样，脑肿瘤在个体肿瘤内以及使用多焦点取样和单细胞测序策略复发时具有令人难以置信的分子异质性。这种异质性可能会导致目前的药物治疗剂对脑肿瘤的有效性有限，以及经过一段时间明显的疾病控制后所感知到的获得性耐药。因此，随着时间的推移跟踪肿瘤基因型的非侵入性方法可以捕获肿瘤异质性的整个格局，因此具有吸引力。

CNS肿瘤成像的放射组学分析有可能表征整个肿瘤的表型，而不是肿瘤的核心，如经常采样用于分子分析，并提供进入肿瘤内部生长模式的非侵入性窗口。以前的研究报道了脑肿瘤的影像学特征，分子途径和临床结果之间的重要联系。胶质瘤的行为与其分子改变显著相关，特别是IDH1/IDH2，EGFR，O6-甲基鸟嘌呤-DNA甲基转移酶（MGMT）以及染色体1p和19q的改变。世卫组织在其年关于神经胶质瘤分类的更新中认识到了脑胶质瘤分子分层的重要性。在术前MR图像上训练的机器学习算法已经能够以80%至95%的灵敏度和特异性区分这些特征，包括胶质母细胞瘤亚型和存活率的预测，高级别和低级别胶质瘤中的IDH突变状态，低级别神经胶质瘤中染色体1p和19q缺失的存在，MGMT甲基化状态，EGFR扩增状态以及EGFR受体变体III以及EGFR细胞外结构域突变的存在（图5）。此外，无监督深度学习方法在鉴别具有不同预后的胶质母细胞瘤中的分子亚群方面显示出前景。

图5用于卷积神经网络（Chang等）的Grad-CAM可视化（Selvaraju等）应用于2个异柠檬酸脱氢酶1（IDH1）/IDH2野生型胶质母细胞瘤的实例和2个IDH1突变型胶质母细胞瘤的实例。彩色图覆盖在原始钆增强的T1加权磁共振图像上，红色加权到IDH状态分类的区分区域。

在脑膜瘤中，良性变异（I级）最常在几种假定的致癌因素中的一种中携带突变，而高级别变异（II-III级肿瘤）则具有可变数量的染色体改变。脑膜瘤患者术前MRI的放射组学分析显示，计算机提取的成像特征能够与脑膜瘤等级以及某些基因组特征密切相关（W.L.B.和H.J.W.L.A.等人，未发表的数据）。此外，定量放射学特征可以辨别微妙之处，例如与I级脑膜瘤相关的非典型特征的数量，超出定性放射科医师评定的成像特征的能力。

垂体瘤，颅咽管瘤，脊索瘤和其他中枢神经系统肿瘤正在进行类似的放射组学分析。除了单肿瘤亚型分析之外，未来的工作还需要提高准确性和灵敏度，以便这些方法可以放心地应用于临床环境，获得比单一或双重标记更细微的分子标记，并容纳与复发和治疗后疾病状态相关的伪影，以允许在患有CNS肿瘤的患者的整个过程中真正纵向应用放射组学。

临床试验应用

预测性生物标志物可以在临床试验中发挥重要作用，因为它们能够选择更可能对治疗有反应的患者，从而提高检测临床益处的机会并降低无效治疗引起的药物毒性风险。用于治疗胶质母细胞瘤的最著名的预测生物标志物是MGMT启动子状态，其中甲基化肿瘤亚型对烷化剂显示出更大的反应。最近，在2个3期临床试验中评估了新诊断的胶质母细胞瘤的抗血管生成治疗，其中靶向VEGF的抗体贝伐单抗在加入标准治疗时没有导致OS改善。目前，没有临床上有用的分子标志物预测抗血管生成治疗的治疗反应。已经使用常规和先进的方式研究了基于成像的生物标志物对新诊断的复发性胶质母细胞瘤的治疗反应预测。基于常规成像特征的放射成像预测因子已经使用接受贝伐单抗治疗的复发性胶质母细胞瘤患者的回顾性单中心数据集进行了鉴定。在对单机构和多机构，单臂数据集的回顾性评估中，使用常规和，弥散MRI特征构建了放射学模型，以区分长期幸存者和短期幸存者。首先从胶质母细胞瘤患者的2个数据集中独立提取基于术前灌注MRI的非参数参数的无监督的放射学特征簇，随后将特征簇组合并评估其与患者存活结果的关联。与生存率低（HR，3.0）相关的放射特征簇与血管生成和缺氧途径的突变相关。这些初步调查是基于接受治疗但没有对照治疗组的患者，因此仅建立这些成像标志物的预后价值。

使用回顾性和前瞻性临床试验数据筛选和验证放射性生物标志物有几个优点。由于这些患者人群相对均匀（包括治疗方案类型，剂量和持续时间以及治疗前和治疗期间的影像学评估时间和频率），因此患者预后的预测准确性可能会提高。在这种情况下构建的预测模型可以更容易地应用于使用类似方案的未来前瞻性试验。最近为脑肿瘤试验标准化成像采集方案的努力也应该增加放射学模型对不同临床试验和实际临床实施的普遍性。

乳腺癌影像

乳腺癌是美国女性中最常被诊断出的癌症，也是癌症死亡的第二大常见原因。自20世纪80年代以来，乳腺癌的5年生存率有了巨大改善，这可能是因为乳腺X线筛查的显著采用以及乳腺癌治疗的改善。乳腺癌是一种异质性疾病，肿瘤在病因，预后和对治疗的反应方面有所不同。雌激素受体（ER）的存在对于对特定治疗（例如，ER阳性疾病患者的他莫昔芬）和预后（ER阴性疾病患者的预后较差）的反应很重要，并且可以定义病因亚型。三阴性乳腺癌为ER阴性，孕激素受体（PR）阴性和人表皮生长因子受体2（HER2）阴性。它们在标准乳腺X线照相术中没有表现出典型的恶性肿瘤迹象，更可能被检测为间隔性和高度恶性肿瘤，并且5年生存率较差。

成像和计算机技术的进步协同作用导致人工智能在乳腺成像的各种任务中的潜在应用迅速增加，如风险评估、检测、诊断、预后和对治疗的反应（表3）

表3乳腺病变的影像学特征，包括检测、诊断、生物学特征、预测预后和治疗反应

乳腺癌筛查：乳腺影像报告和数据系统模拟到数字

乳腺癌影像学中的CADe和CADx已经发展了几十年。自20世纪90年代末以来，专门用于筛查乳腺X线解释的CADe系统已经在临床上得到了常规应用。放射科医生对癌症的检测受到结构噪声（伪装成正常解剖背景），视觉搜索模式不完整，疲劳，注意力分散，对细微和/或复杂疾病状态的评估，大量图像数据以及物理条件的限制。乳房图像本身的质量。在计算机辅助检测中，计算机旨在查找可疑病变，并将分类留给放射科医生。

尽管CADe继续被开发用于筛查乳腺摄影术，研究人员也试图通过结合预定义的算法和新的深度学习方法，在3D超声、乳腺MRI和乳腺断层合成图像上自动检测乳腺病变。计算机检测三维乳腺图像的动机是随着三维超声和磁共振成像的到来而产生的，用于筛查乳腺组织致密的妇女。

自20世纪90年代初以来，CNN已被用于医学图像分析，用于检测数字化乳腺X光片中的微钙化，以及区分活检证实的肿块和乳腺X光片上的正常组织。最近，深度学习的方法已经允许计算机辅助检测乳腺病变的乳腺磁共振成像，超声波和乳腺X光片。

乳腺癌风险评估：密度和实质

已经开发了计算机视觉技术来提取乳腺图像上实质组织模式的密度和特征，以产生定量的生物标志物，以用于乳腺癌风险预测以及最终用于个性化筛查方案。

基于区域和基于体积的密度评估都用于估计乳腺钼靶密度，因为密度增加既是乳腺癌的危险因素，也是掩盖病变的掩蔽效应。乳房密度是指乳房中纤维腺组织的数量相对于脂肪组织的数量。在全视野数字乳腺摄影术（FFDM）中，这些组织类型是可以区分的，因为纤维腺体组织比脂肪组织对X射线的衰减要大得多。因为FFDM是乳房的2D投影，所以3D百分比密度值是估计出来的。

除乳腺密度外，还有证据表明，实质形态的变异性（例如，描述致密组织的空间分布特征）也与乳腺癌风险有关。通过使用纹理分析，当在乳房X射线照片的分析中采用偏斜度测量来描述密度变化时，研究人员已经表征了FFDM区域内灰度级的空间分布。其他人利用纹理分析和深度学习来区分BRCA1/BRCA2基因突变携带者（或对侧乳腺癌妇女）和乳腺癌低风险的女性，并利用近个病例发现，乳腺癌高风险妇女的乳腺密度高，实质形态粗糙，对比度较低（AUC，约为0.82）。进一步的研究将纹理分析应用于乳腺断层合成图像，以描述实质模式，最终用于乳腺癌风险评估，初步结果表明，纹理特征与乳腺断层合成（回归分析中P=0.）上的乳腺密度的相关性好于数字乳腺X光片。

此外，在动态对比增强（DCE）MRI上，乳腺实质模式的特征也被扩展到乳腺实质增强（BPE）。在50名BRCA1/BRCA2携带者的有限数据集中，BPE的定量测量与乳腺癌的存在相关，BPE百分比的相对变化可预测降低风险的输卵管卵巢切除术后乳腺癌的发展（P0.05）。深度学习方法越来越多地被评估用于评估乳腺密度和实质特征，其中的一个例子包括根据其BRCA1/BRCA2状况评估转移学习对处于正常乳腺癌风险和高风险女性之间的区分的绩效评估。

人工智能提高乳腺癌诊断水平

自20世纪80年代以来，各种研究人员一直在开发CADx的机器学习技术，以区分乳腺良恶性病变。CADx的这些人工智能方法涉及肿瘤的自动表征，最初由放射科医生或计算机指示。计算机描述可疑区域或病变的特征和/或估计其发病概率，将患者管理交给医生。

将人工智能方法应用于乳腺图像数据，可以定量地获得肿瘤的大小、形状、形态、纹理和动力学特征。例如，在乳腺MRI上使用对比剂摄取的动态评估可以让研究者根据异质性来量化癌症，产生空间特征和动态特征的表型。例如，熵是一种随机性的数学描述，它提供了肿瘤内模式异质性的信息，从而描述了对比增强乳腺MRI成像的肿瘤内血管系统摄取（即对比度摄取）的异质性模式。这种分析可能反映血管生成和治疗敏感性的异质性，如NCI的癌症基因组图谱（TCGA）乳腺癌表型组所示。

使用CADx，对预定义算法和深度学习算法进行了评估。值得注意的是，研究人员已经表明，在区分良恶性病变的任务中，使用人类工程或深度学习特征在乳腺病变分类中表现良好，并且这两种方法的“融合”可以在统计学上显著改善乳腺癌的诊断性能。在所有3种乳腺成像模式（例DCE-MRI病例、例FFDM病例和例超声病例）中，“融合”分类器表现最佳，表明在乳腺癌诊断检查中，工程和深度学习肿瘤特征的互补使用潜力（DCE-MRI:AUC=0.89[标准差=0.01]；FFDM:AUC=0.86[标准差=0.01]；超声：AUC=0.90[标准差=0.01]）。其他研究者使用转移学习，在个数字化屏幕胶片和FFDM上预训练CNN，用于描述个乳腺断层合成体积上的肿瘤，它证明了在成像模式之间传递成像模式知识的能力。

基于图像的预测性生物标志物

除了CADe和CADx之外，还有2种人工智能在乳腺成像中的应用，包括通过产生精确医学中基于图像的乳腺癌预测表型来评估分子亚型、预后和治疗反应。乳腺癌研究的一个主要兴趣领域是试图了解肿瘤的宏观外观与其周围环境之间的关系。这些关系可以从临床乳腺图像和风险、预后或治疗反应的生物学指标中提取。这种生物标记物的有效开发得益于多种患者检查信息的整合（即临床、分子、成像和基因组数据；即通常在诊断检查和随后的活检中获得的其他“组学”）。

在NCI的TCGA乳腺表型组的一项合作努力中，多学科研究人员对84个实体乳腺肿瘤进行了表型特征分析，以获得有关潜在分子特征和基因表达谱的基于图像的信息（图6）。即使在控制肿瘤大小后，增强纹理（熵）与分子亚型（正常样、管腔A、管腔B、HER2富集型、基底样）之间也存在显著的统计学相关性（病变≤2cm时P=0.04；病变从2到≤5cm时P=0.02）。磁共振成像与基因组的关联也被揭示出来，进一步加深了对调节肿瘤表型发展的遗传机制的理解。

图6磁共振成像显示乳腺癌基因组特征与放射组学表型的显著相关性。基因集富集分析（GSEA）和线性回归分析相结合，将基因组特征（包括microRNA（miRNA）表达、蛋白质表达和基因体细胞突变等）与6类放射组学表型相关联。在这个图中，每个节点代表一个基因组特征或一个放射组学表型。每一行都是一个确定的具有统计意义的关联，而没有描述非显著关联。节点大小与其相对于类别中其他节点的连接性成比例。

例如，关于预测患者对特定治疗的反应，在美国医学院接受新辅助治疗的患者中，从乳腺MRI（名女性：40名有复发，名无复发）半手工描绘功能性肿瘤体积被确定为无复发生存率的预测指标放射成像网络（ACRIN）研究，显示了自动化的潜力。

前列腺癌影像

前列腺癌是美国男性中诊断率最高的非皮肤性恶性肿瘤，也是导致癌症相关死亡率的第二大原因。前列腺癌的发生率、发病率和死亡率的统计数据可以用多种不同的方法进行检验。它是一种非常常见的癌症，因为它是一种“衰老的肿瘤”，但它的疾病特异性死亡率非常低，所有这些都加强了它作为一个影响大量人口的复杂公共卫生问题的特征。虽然前列腺癌是一种严重的疾病，但大多数被诊断为前列腺癌的男性并不会因此而死亡。前列腺癌患者的5年生存率从转移性疾病患者的30%到局限性疾病患者的%不等。目前前列腺癌诊断的主要临床问题包括：1）过度诊断和过度治疗，主要是由于无法预测特定癌症的侵袭性和风险；2）靶向活检取样不足，导致误诊和低风险前列腺癌患者的疾病进展。在荟萃分析中，报告的非临床意义前列腺癌的过度诊断率高达67%，导致不必要的治疗和相关的发病率。由于这种临床行为的范围，有必要将具有临床意义的肿瘤（活检Gleason评分为7分和/或病理体积为0.5ml的患者）作为治疗候选者与具有临床意义的肿瘤并且可以安全地接受主动监测的患者区分开。人们注意到，早期前列腺癌积极治疗的潜在生存益处受到惰性疾病不必要治疗的损害。

前列腺癌的生物学异质性导致了不同的临床结果，从惰性到高侵袭性肿瘤的高发病率和死亡率，以及治疗计划、治疗反应和患者预后的差异。这反映在国家综合癌症网络指南（NationalComprehensiveCancerNetworkguidelines）中纳入了基因组图谱，包括Decipher（GenomeDxBiosciences，加利福尼亚）、OncotypeDXProstate（genomicHealthInc，加利福尼亚州）、Prolaris（MyriadGeneticsInc，犹他州）等。在进行分子表征的同时，人工智能也有可能使临床医生在前列腺癌的检测、定位、特征、分期和监测方面发挥作用。目前还没有广泛的多中心试验，因此许多初始工作仅限于单中心、单算法分析和小数据集。然而，一些组织，如美国国家卫生研究院和MICCAI，正在开发基础设施，以允许更大的、注释良好的数据集可用于人工智能开发。

主要基于有监督机器学习的计算方法已经成功地应用于磁共振成像和超声成像，以检测可疑病变，并将临床意义重大的癌症与其他癌症区分开来。近年来，深度学习在前列腺癌筛查和侵袭性癌症诊断中的应用取得了令人满意的结果。

多参数磁共振成像（mpMRI）为检测和定位可疑的具有临床意义的前列腺病变提供所需的软组织对比度，并提供有关组织解剖、功能和特征的信息。重要的是，它具有检测所谓的“临床意义”疾病的优越能力，即Gleason模式为4或更高（Gleason评分≥7）和/或肿瘤体积0.5cm3。近年来，前列腺癌的mpMRI检查量不断增加，因为mpMRI能够检测这些病变并允许有针对性的活检取样。来自英国的一项大规模人群研究表明，在初次活检前使用mpMRI作为分诊依据可以减少四分之一不必要的活检，并可以减少临床上不重要疾病的过度诊断。这在小于最佳值的数据集中得到了进一步验证。在对名患者进行的多国精确研究中，在活检前随机接受mpMRI检查的男性，其对具有临床意义的疾病的检出率明显高于目前采用10核到12核经直肠超声引导活检的标准（38%比26%）。

mpMRI的增长趋势引起了对经验丰富的放射科医生的需求，以解读爆炸性增长的肿瘤学前列腺MRI报告。此外，阅读具有挑战性的病例并减少高的观察者间意见分歧是前列腺MRI仍然面临的挑战。年，欧洲泌尿生殖放射学会、美国放射学院和AdmeTech基金会发布了前列腺成像报告和数据系统（PI-RADS）的第二版。这为放射科医师阅读和解释前列腺mpMRI提供了指导，目的是提高mpMRI结果解释和交流的一致性。在过去的10年里，人工智能模型已经发展成CADe和CADx系统，用于检测、定位和描述前列腺肿瘤。结合PI-RADS，精确的CAD系统可以增加相互间的可靠性，并提高mpMRI读取和解释的诊断准确性。初步分析表明，增加CADx系统可以提高放射科医师对前列腺癌的诊断能力。

mpMRI-CADx系统的前期工作主要集中在经典的、有监督的机器学习方法上，包括特征抽取器和浅层分类器的组合。在这类人工智能系统中，特征工程对CAD系统的整体性能起着核心作用。CADe和CADx系统的组合使用了强度（intensity）、解剖学、药代动力学（药代动力学模型）、纹理（texture）和块性（blobness）特征。药代动力学是一种详细的指标，可以从通过给定体积组织的静脉造影剂的时间-信号分析中提取。它们包括wash-in和wash-out等参数。纹理特征也是基于信号的，在很大程度上依赖于成像技术。其他人使用mpMRI序列计算的强度特征，包括T2加权MRI、表观扩散系数、高b值、扩散加权MRI和质子密度图T2估计，或者他们只使用从药代动力学分析和扩散张量成像参数图中提取的特征。类似的基于图像的特征也包含在CAD系统中，其中许多系统使用支持向量机进行分类。

在过去的几年里，深度学习网络，特别是CNNs，已经彻底改变了前列腺癌检测和诊断的研究。这些方法使用不同的模态类型、CNN结构和学习程序来训练前列腺癌分类的深层网络，并取得了最先进的性能。一些研究者使用CNN对MRI发现进行分类，并使用自动窗口机制来克服MR图像的高动态范围和归一化，而另一些研究者使用mpMRI图像的不同组合，将每个模态叠加为RGB图像的2D通道，并将其用作训练示例。此外，可以设计3DCNN，使用基于MRI的特定参数，如表观扩散系数、高b值和容积转移常数（Ktrans）模式。

深度学习系统已被应用于同时对前列腺病变进行定位和分类。无论是从头训练还是预训练模型的迁移学习，都能成功地训练CNNs用于前列腺癌MRI诊断。在CNNs的最后一层中明确增加了具有解剖学意义的特征，这已经成功地提高了CNNs的性能。除了磁共振成像，人工智能技术通过结合超声数据，特别是射频数据，对前列腺癌进行分类，已经取得了有希望的结果。在这里，经典的机器学习方法和深度学习都被用来训练分类器，以便在时域超声数据中对前列腺癌进行分级。

人工智能用于前列腺癌的检测和定性的研究结果是有希望的，并显示出持续的改善。最近对前列腺癌图像分析的研究揭示了从特征工程和经典机器学习方法向深度学习和使用大型训练集的过渡。与肺癌和乳腺癌不同，前列腺癌的临床常规尚未采用规范的CAD系统。然而，最近在中型数据集上的深度学习技术取得的成果，如PROSTATEx基准测试，是有希望的。很明显，全世界前列腺MR检查量增长迅速，对准确解释的需求也在增加。准确的CAD系统将提高前列腺MR的诊断准确性，从而更好地照顾个别患者，因为良性和惰性肿瘤（假阳性）的患者较少需要接受侵入性活检和/或根治性前列腺切除术。相反，早期发现前列腺癌可以改善临床上有意义的前列腺癌患者的预后（Gleason模式4）。前列腺癌的计算机辅助检测和诊断系统有助于临床医生通过潜在的减少漏诊或过度诊断可疑靶点的可能性，尽管这需要在常规临床纳入之前进行更多的试验验证。

挑战与未来方向

尽管有报道称人工智能在肿瘤成像中取得了成功，但在广泛应用于临床之前，必须克服一些限制和障碍。随着对CT和MR成像需求的不断增长，医疗服务提供者不断产生大量的数据。包括图像存档和通信系统（PACS）和医学数字成像和通信（DICOM）在内的标准确保了这些数据的组织便于存取和检索。然而，这些数据很少在标签、注释、分段、质量控制或适用于当前问题的方面进行整理。医疗数据的管理是开发自动化临床解决方案的一个主要障碍，由于其需要训练有素的专业人员，使得这个过程在时间和成本上都很昂贵。数据密集型方法（包括深层神经网络）加剧了这些问题。无监督和自我监督的方法不需要明确的标记，因此有望缓解其中一些问题，而合成数据有可能实现更快的治疗途径，解决不可避免的类别不平衡，并减轻患者隐私问题。标准化基准测试在医学领域尤其重要，特别是考虑到众多的成像方式和解剖部位以及采集标准和硬件。尽管可以公开获得的医疗数据量是一个令人鼓舞的进步，但研究界尚未就可用于在性能，通用性和可再现性方面进行比较和对比工作的特定数据集达成共识。此外，应改进对现有数据集的获取，以促进知识协作。应鼓励机构、专业人士和政府团体共享经验证的数据，以支持人工智能算法的开发，这需要克服某些基本的技术、法律和道德问题。例如，美国国家卫生研究院最近共享了胸部X线和CT数据存储库，以帮助人工智能科学家。这种努力使疾病状态的受众范围扩大了。

另一个限制包括AI的可解释性以及由于特定结果背后的原因而询问此类方法的能力，以及对失败的预期。尽管目前的研究状况将性能提升放在了可解释性和透明度之上，但人工智能的可解释性是一个活跃的研究领域。在人工智能系统中，信任和透明的好处会因其性能的不同而不同，允许在人工智能是非人类的情况下识别失败，从而将超人类人工智能转化为学习资源。从法律角度来看，政策制定者已经注意到：关于通过解释改进人工智能问责制的讨论最近在《欧盟一般数据保护条例》中进行了辩论，并继续出现在法律目前要求解释的敏感应用中，或预计在不久的将来需要。

从伦理的角度看，存在一个问题：临床部署的人工智能系统的希波克拉底誓言是什么，如何执行？尽管数据整理和建模实践在本质上是有偏见的，因为它们考虑到了特定的患者群体，但必须有意识地努力确切地了解谁将是此类技术的最终受益者和利益相关者。算法在设计上可能是不道德的，并且可能会加剧已经存在的在提供治疗护理和转化利润之间的紧张关系。此外，必须采取一种防止“习得性无助（learnedhelplessness）”的措施，以遏制对自动化的高度依赖和对常识的最终放弃。最后，自动化系统还可能挑战医患关系中的责任动力（dynamicsofresponsibility），以及对保密性的期望。

在监管方面，自20世纪90年代以来，美国食品和药品管理局（FDA）一直在对自动化临床决策系统进行监管。随着新预测技术（包括深度学习）的出现，寻求批准的预测模型必须根据训练中使用的标记数据进行进一步审查预期的用例，它们的通用性和针对边缘用例的鲁棒性，以及它们的终身学习方面，因为它们会随着学习和数据的不断更新而不断更新。人工智能应用软件很可能需要经过严格的测试，新提交的软件必须经过严格的测试才能获得监管部门的批准，包括质量控制和风险评估。由于云计算和虚拟化越来越多地被用来处理医疗数据，医疗信息技术正逐渐成为“大数据”革命的一部分。这为整合通常是分散的最先进的人工智能系统提供了一个良好的环境。然而，它引起了数据安全和隐私问题，因为保持医疗保险的可移植性和责任法案的合规性至关重要。当前的网络安全研究开始提供解决方案，包括加密网，其中同态加密允许神经网络对加密数据进行训练和推理。

今天的医学诊断范式集中于视觉上可识别发现的检测，这些发现提示图像中的离散病理改变。然而，这种单一疾病过程检测的重点可能会遗漏个体作为一个整体的并发状况。成像方法，从简单的X射线到先进的断层成像方法，如MRI或CT，为评估肿瘤周围器官系统提供了机会。

随着人工智能的集成，生物网络的复杂评估可能会对反应和预后的评估以及治疗计划产生深远的影响。除了发现肿瘤外，影像学还可以发现肿瘤以外邻近或远处器官的变化，从而改变患者对最终导致死亡的系统性疾病的易感性。这可能是疾病发展本身的副产品，也可能是治疗（如放疗或化疗）的副产品。例如，在接受胸腺癌或乳腺癌治疗的患者中，化疗可能会导致心肌损伤，而放射治疗则会促进晚期冠状动脉粥样硬化；癌症存活的患者也会经历高比率的心血管事件。总的来说，这些心脏毒性可能会在癌症监测过程中的常规成像上产生信号，并在疾病发展的早期阶段通过捕捉疾病过程全景综合分析系统进行检测。将人工智能应用于这一临床场景的最初概念源于这样一个发现：胸部肿瘤和心血管病理学彼此相邻，且可以同时检测到（即胸部CT上的冠状动脉钙化或心包脂肪）。因此，基于人工智能的自动检测和定量算法的发展将使心脏代谢标志物的评估无需额外成像。通过同时评估来自同一数据源的额外风险将人工智能的作用扩展到筛查。由于医疗保健的最终目的是预防疾病，因此，建立准确的风险模型对于指导可行的风险调整策略至关重要。

虽然人工智能可以检测到可能对临床有益的偶然发现，但这些发现也可能在临床上是不相关的，如果不在正确的临床背景下仔细分析，可能会增加患者的压力、医疗费用和治疗的不良副作用。很可能在人工智能的早期阶段，当人类专家将继续在把关人工智能输出方面发挥关键作用时，人工智能检测到的大多数偶然发现仍将由人类进行评估，以辨别它们是否具有临床意义，方式与人类检测到偶然发现时相同。随着时间推移，人工智能系统逐渐成熟，这些偶然发现可能成为标准数据评估和报告的一部分，就像在患者临床环境中评估和报告原发性病变一样。

此外，影像学并不是衡量疾病的一个孤立指标。越来越多的人认识到，肿瘤的分子特征，包括肿瘤的非侵入性血液生物标志物、社会经济地位，甚至社会网络，对肿瘤患者的预后有影响。数据来源也在迅速扩展，不仅仅是直接的医疗检查，还包括可穿戴设备、手机、社交媒体、非结构化电子健康记录以及数字时代的其他组成部分。人工智能非常适合于随着时间的推移整合平行的生物、人口和社会信息流，以改进患者预后的预测模型。

随着人工智能的力量和潜力越来越被证明，人工智能向常规临床实践的过渡还有多个方向。对于影像学分析，如果要准备取代临床医生的工作流程，则与对照研究中的人类专家相比，人工智能方法的准确性和预测能力需要进行显著改善，并需要具有可比的或更好的疗效证明。这显示了在几种疾病条件下的初步前景，但需要在前瞻性试验和医生、技术人员和物理学家的教育中提供更多的临床实用性证据，以便广泛应用。尽管人类专家在查看人工智能生成的结果时可能总是会有一个“黑匣子”，但数据可视化工具越来越可用，可以在一定程度上直观地理解算法是如何做出决策的。

整合疾病相关和无关因素的综合数据集和结果的整理也将有助于训练和扩展人工智能系统，以考虑肿瘤本身以外的风险。在全球范围内，与专家临床医生接触的机会有限或接触不常见的病理学，人工智能可以提供一系列“专家”经验来解释疾病。相反地，没有人类专家提供的基本事实而预测结果的策略可能会破坏今天临床医生和患者熟悉的传统工作流程。此外，将人工智能更多地纳入卫生资源和结果的监测可能会提高效率并降低成本。与任何新的创新技术一样，发展的可能性超出了当前的想象。

编译自：BiWL,HosnyA,SchabathMB,GigerML,BirkbakNJ,MehrtashA,AllisonT,ArnaoutO,AbboshC,DunnIF,MakRH,TamimiRM,TempanyCM,SwantonC,HoffmannU,SchwartzLH,GilliesRJ,HuangRY,AertsHJWL.Artificialintelligenceincancerimaging:Clinicalchallengesandapplications.CACancerJClin.Mar;69(2):-.doi:10./caac..文中观点均为原作者观点，仅供专业人士交流目的，不用做商业用途。

年1月11日