twelve 韩国宏团队:对《“Six-and-twelve模型”能否助力临床?》一文的答复

编辑:
发布时间: 2020-12-15 20:56:52
分享:

doi.org/10.1016/j.jhep.2019.07.009

首先,来自西京消化病医院、国家消化系疾病临床研究中心的王秋和等向Bourlière等将前者的“Six-and-twelve模型”在法国中心进行验证表示感谢,认为获得来自不同地区的结果是十分必要的。

在对前期发表的研究结果进行阐释前,笔者先作以下澄清:

笔者的模型首先是一个连续型预测模型,其评分计算公式为“最大肿瘤直径+肿瘤数目”。只有将其作为连续型预测模型使用才能进行个体化预测,而“6”和“12”仅是为了便于快速进行危险分层所选取的截断点。截断点的使用能够让模型更简便易用,但在分层过程中会低估层内异质性、高估层间异质性,因而会牺牲模型的准确度。Bourlière等的结果中有趣的一点就在于,G2层肿瘤负荷上限为G1层上限的2倍,而两组患者中位生存时间接近。可能的原因是这两层的患者的肿瘤数目与大小之和主要分布在“6”这个截断点附近,尤其是该中心66%的患者为多结节,G1层患者的肿瘤数目与直径之和很容易超出3而接近6。这种由截断点带来的信息丢失也正是笔者首先制作列线图以提供个体化预测,然后才选取截断点进行分层预测的原因。

而这个现象更深层次的问题在于研究人群。研究人群是模型预测能力的决定性因素。一个预测效果良好的模型或分期系统在一个完全不同的人群中预测效能会降低。这一问题在肝癌这个人群间异质性非常明显的疾病中尤为突出,这也解释了为什么除BCLC分期外多数分期系统争议不断,而BCLC分期本身也亟需进一步完善。Bourlière等的研究人群以多结节、小直径[32 mm]肿瘤为主,与笔者以单个结节、大直径[61 mm]肿瘤为主的研究人群明显不同。这一差异可能是导致笔者的预测模型在外部验证中预测性能降低的原因。然而, 即使在使用了截断点造成信息丢失且G3层患者样本量极小的情况下,笔者的模型仅使用肿瘤负荷指标而不涉及肝功能和体能评分即可达到与BCLC分期系统相近的预测能力。这进一步提示肿瘤负荷在欧洲患者中也是非常重要的预测因素。虽然如此,“Six-and-twelve”模型建立的初衷并非为了取代BCLC分期,而是为了进一步将BCLC分期中TACE最佳目标人群进行分层,从而为未来临床决策和研究设计提供重要参考。

此外,尽管目前的研究中肝功能不是标准TACE目标人群的独立预测因素,笔者依然同意Bourlière的观点,即在不同人群中,肝功能、甲胎蛋白、体能评分等指标的异质性会更大,这些因素对预后的影响也会更为显著,而加入它们则有望进一步提高模型的预测能力。正如HAP评分至今仍在不断被修正一样,笔者的模型在面临更多维的异质性的时候也需要通过不同人群的大样本外部验证加入新的指标并不断修正。对于肝癌这种异质性很大的疾病很难找到一个模型在不同人群中百试百灵,但笔者希望通过未来的不断试错让笔者的模型不断改进。

西京消化病医院

国家消化系疾病临床研究中心

王秋和,夏冬东,白苇,王恩鑫,韩国宏 报道


原报道:

相关阅读
热门精选
孩子 皮肤