根据博弈论优化肿瘤治疗,不会数学也能看懂的送分题

文 / 医脉通肿瘤科
2018-08-21 00:32

导读

博弈论最初由John von Neumann在20世纪40年代末提出,是关于战略决策的数学研究,广泛用于预测个体、群体甚至国家之间的冲突,现在已成为经济学的标准分析工具之一。

小编第一次了解这个理论是通过《美丽心灵》,里面的男主原型就是著名的“纳什均衡”提出者约翰·纳什。

关于理论具体内容,五行缺“理”的小编无法把它讲得透彻,感兴趣的可以自行搜索。这么说领导看到怕是要扣工资,小编只能硬着头皮搬来博弈论里面著名的“囚徒困境”漫画。

警察抓到了两个入户盗窃的坏人A和B,他们两个共同犯罪,理论上应该有难同当。

如果两个人都够义气,打死也不说,那么盗窃罪名不成立,只能以私闯民宅各判1年。

警察也不是吃素的,把A和B分开审讯,玩一玩攻心术和离间计,案子说不定就破了。鲁迅说过:堡垒最容易从内部攻破。

警察分别跟A和B说:坦白从宽,可以减刑释放。你们犯了什么事别以为我不知道,不说就加重惩罚!

A想减刑,心里的小九九就出来了:如果B没有坦白,揭发检举可以立功,那么B判20年,自己被释放;如果B坦白了,我不坦白那就是我判20年;如果他也坦白我也坦白,顶多关5年。横竖来看,都是坦白比较划算!

A这个算盘B也在打,于是两个人同时坦白了,证据事实清楚,两人都判5年。

从这个故事可以看出,两个人都不坦白才是最优解,任何一方偏离了这个最优组合,都会使结局变差,这就是纳什均衡。

博弈论和肿瘤

这明明是一道数学题,博弈论和肿瘤有什么关系呢?

肿瘤治疗最怕什么?疾病进展。

疾病进展是为什么?肿瘤耐药。

如果把医生治疗和癌细胞当成博弈论的游戏主角,治疗完全战胜了癌细胞,那么治愈就实现了。然而大多数转移性肿瘤,灭绝是不可能实现的。因为癌细胞总有对抗策略,对治疗产生耐药性。

不过,这个游戏里面医生有两个绝对的优势:

  1. 只有医生可以理性地玩,可以预见未来趋势;癌细胞只能适应环境,无法预测医生的治疗也不能适应医生尚未应用的治疗。
  2. 医生是领导者地位,他首先发挥作用了,追随者癌细胞才能做出反应,这就是很典型的斯塔克尔伯格(Stackelberg)模型。

在目前的治疗中,我们没有利用这种不对称性。一般是以最大耐受剂量(MTD)连续或重复应用药物,直至不可耐受或疾病进展。在一开始,这样确实能最大程度的杀伤肿瘤细胞,然而长远来看,这是不明智的。

因为聪明的癌细胞不会坐以待毙,它们也会迅速进化并产生适应性,于是治疗失败。

原本医生处于领导者地位,肿瘤细胞是布,医生出剪刀就可以干掉它。如果医生一直出剪刀,癌细胞受到恒定且可预见的杀伤力,它也可以进化成让剪刀挫骨扬灰的石头。

曾经有一个身份摆在你面前没有好好珍惜,现在再也不能预测和引导肿瘤的行为了,反而要想别的办法来应对癌细胞的进化,于是领导者变成追随者。

如何应用博弈论?

回到“纳什均衡”理论,肿瘤细胞已经发生改变了,还在用原有策略,治疗失败不可避免。我们需要放弃目前的静态治疗方案,整合肿瘤的耐药性进化动力学,使用动态的治疗策略。

如何采取动态设计呢?我们又要开始讲故事了。

傻狗和美狼都要追松鼠(他们为什么要追松鼠,我也不知道),傻狗只会整天追着松鼠后面跑,气喘吁吁始终没有追上。美狼就在旁边看他们两个跑,发现松鼠每次都会沿同样的路线跑到最近的那棵树上,美狼守树待鼠,追到了松鼠。

追随者和被追随者的地位转换,一目了然。游戏的两个关键词是“预测”和“适应”。

我们要打破目前这种治疗——耐药——进展——再治疗的平衡,需要预测癌症的耐药性产生时间点,打破癌细胞对药物的适应。

实际上,医生在处方药物治疗癌症时,并不完全了解药物的机制和生化动力学。我们一般在数周或数月之间观察肿瘤大小,来判断治疗反应。除此之外,只有在毒性效力发生变化时,才会调整治疗策略。

根据游戏术语,临床癌症治疗是一种不寻常的竞争,可以在不同的时间点“开环”和“闭环”。在每个治疗周期中,因为医生不能直接观察癌细胞的策略,也无从调整治疗策略,所以游戏为“开环”游戏。但是,如果在某些时间点,医生识破了癌症的“阴谋”,提前采取措施,那么游戏就会变成“闭环”。

通过一些成功案例中的循环动力学,可以探测肿瘤的关键耐药性性和敏感人群,包括:

  • 癌症人群可用策略
  • 肿瘤测量的相对大小
  • 癌症人群的动态变化(过去和未来)
  • 癌症进化动态(过去和未来)

与治疗目标结合

当我们开始利用这种游戏策略时,就不再需要一开始马力全开,用最大剂量去打击肿瘤,而是一步步诱敌深入。

当预期癌症能治愈时,第一步目标为同质化癌细胞,然后通过针对性策略将癌细胞一网打尽。这种方法被称为“双重治疗”,已经被广泛分析并纳入临床观察。

如果无法实现治愈,我们的目标则是尽量延长进展时间。这时需要利用进化动力学来抑制耐药性表型细胞的生长。因为根据定义,医生不能控制耐药性细胞,治疗只能曲线救国,尽力保留治疗敏感的细胞,以抑制耐药性细胞生长。

对于耐药性细胞的管理,需要更明智地使用药物。这一点,在抗生素领域已经有深刻体会了。

实例分享

多年以来,转移性前列腺癌的治疗都集中在抑制雄激素的研究上。但患者总是会耐药,有学者提出了间歇性雄激素剥夺的概念,开发出双相雄激素治疗策略。

与常规治疗不同的是,在治疗间期给予雄激素,以诱导肿瘤反应并恢复正常雄激素表达,使它们再次易受雄激素剥夺疗法的影响。

用阿比特龙治疗转移性去势抵抗性前列腺癌患者的研究就是应用博弈论来延迟耐药性的发生。

图A上:AR阳性细胞占绝对优势,连续ADT快速选择过表达CYP17A的抗性群体,导致肿瘤进展。

图A下:ADT直到肿瘤负荷减少一半(基于PSA测量),然后撤回。在没有治疗的情况下,AR阳性细胞的适应性优势抑制抗性群体生长,从而通过ADT延长肿瘤控制。

图B中AR阳性细胞优势不如图A,下排使用针对AR阳性(ADT)和CYP17A1(阿比特龙)细胞的交替治疗,以及治疗空窗期来控制AR阳性和CYP17A1群体,同时最大限度地减少AR阴性细胞的生长。

Antonia等的一项研究表明,当小细胞肺癌进化出对免疫治疗的抗性时,它们对随后的细胞毒性反应大大增加。

总结

医生可以利用癌症治疗游戏固有的不对称性和斯塔克尔伯格模型中领导者低位的优势,采用更加动态的治疗方案来整合生态进化动力学并相应地调节治疗,从而改善结果。

实施这种方法将需要新的肿瘤反应指标,包括生态(肿瘤大小)和进化(耐药性分子机制和耐药性群体的相对大小)变化。目前肿瘤检测手段层出不穷,这些在未来都不会是问题,我们需要的是更有战略的眼光和更有计划的动态总结。

随着游戏的进行,医生可以应用额外的治疗来玩这个游戏,这些治疗可以与之前的相同,也可以不同。随着治疗的调整,肿瘤细胞也需要不断响应和适应。

说到这,文中追随者和领导者的游戏,是不是很像皇上和璎珞的互动。

皇上:我生气了——她应该来求饶——她怎么还不来求饶——你快来哄我啊!!

璎珞:皇上生气了——才不求饶——就等着皇上来找我——皇上,你还喜欢人家不?

好了,这是一个刊登在肿瘤学前十期刊JAMA Oncology 的严谨严肃的学术文章,不是什么爱情游戏。小编要去追剧了~

参考文献:

[1] Staňková K, Brown J S, Dalton W S, et al. Optimizing Cancer Treatment Using Game Theory: A Review[J]. JAMA oncology, 2018.

[2] Evans C P. Bipolar androgen therapy: an intriguing paradox[J]. The Lancet Oncology, 2018, 19(1): 8-10.

1.2018 CCO | 徐兵河教授:乳腺癌的明天是什么?

2.2018 CCO | 季加孚教授:胃癌治疗中国优势有哪些?

3.从三线到一线,西妥昔单抗如何奠定在结直肠癌治疗中的地位?