代谢组学检测技术与人工智能大数据分析在Ⅱ型糖尿病发病风险预测中的价值

文 / 健康小助手滴
2021-02-01 18:30

口服葡萄糖耐量试验(OGTT)是目前临床诊断糖尿病的金标准,但往往达到诊断标准时,病情进行性发展已不可逆转。通过高通量质谱检测平台获得糖尿病队列及正常对照队列血清中的代谢物信息,建立疾病代谢组数据库;并对获得的代谢组数据进行人工智能建模、机器学习及优化,构建出Ⅱ型糖尿病发病风险评估模型。只需要极少量的血清样本,即可采用代谢组质谱检测平台和人工智能大数据分析平台,建立个体的代谢组“健康画像”,精准评估Ⅱ型糖尿病发病风险,对延缓或避免疾病的发生具有非常重要的应用价值和意义。

Ⅱ型糖尿病是一种由多种基因遗传与环境因素综合导致的一组异质性和进行性的代谢紊乱性疾病。据2015年第七届国际糖尿病联合会(IDF)数据显示[1],2015年全球糖尿病患者为4.15亿,预计到2040年将达到6.42亿,是继心血管疾病和肿瘤后危害人类健康的第3大疾病。糖尿病是以长期高血糖为基本特征的代谢性疾病,造成视网膜、肾脏、心脑血管、下肢血管病变等多种糖尿病慢性并发症,是糖尿病致残及致死的主要原因。口服葡萄糖耐量试验(OGTT)是目前临床诊断糖尿病的金标准,其初期无明显症状且潜伏期长,往往达到诊断标准时,病情进行性发展已不可逆转。目前Ⅱ型糖尿病确切机制尚不十分清楚[2],早期发现和早期诊断糖尿病以及良好的血糖控制是目前该病防治最有效的方法,代谢组技术及人工智能大数据技术的发展和成熟为解决这一难题奠定了重要的基础。

随着科学研究的进展,人们发现单纯研究某一方向(基因组、蛋白质组、转录组等)无法解释全部生物医学问题,科学家就提出从整体的角度出发去研究人类组织细胞结构、基因、蛋白及其分子间相互的作用,通过整体分析反映人体组织器官功能和代谢的状态,为探索人类疾病的发病机制提供新的思路。代谢组主要包括基因组学、蛋白组学、代谢组学、转录组学、脂类组学、免疫组学等。如果说基因组学反映了“可能发生的”,转录组学反映了“将要发生的”,蛋白质组学反映了“正在发生的”,那么代谢组学反映了“已经发生的”,因此代谢组学较之其他“组学”方法有其独特的作用。代谢组学是继基因组学、转录组学、蛋白质组学之后的一门新学科,是系统生物学的重要组成部分[3]。代谢组学主要用于识别和测量由于内部或外部环境刺激的整个机体代谢应答反应[4]。代谢组学可以测量基因组学和蛋白质组学潜在变化表现出的结果,更能直接分析终端产物,因此,代谢组学用于诊断和评价Ⅱ型糖尿病比传统的方法更具有优势。

从1999年代谢组学的概念正式提出至今,代谢组学的应用日渐增多,目前代谢组学研究技术主要包括磁共振和质谱法两类。磁共振所需样本量少,且具有无创性特点,能够对样本进行动态检测,多维磁共振技术也增加了其分辨率及灵敏性。质谱法的应用更加广泛,可联合气相色谱、高效液相色谱、高效毛细管电泳等技术,从而分离同一样本中多种共存代谢物,极大增强了分辨率及灵敏性[5]。代谢组学的研究方法可分为非靶向及靶向代谢组学分析,非靶向分析旨在尽可能多地获取代谢表型,常用于差异代谢物的发现;而靶向分析则针对特定几种代谢物(通常为属于同一代谢通路或具有相似结构的一组化合物)进行分析,其最大优势是可以对代谢物进行定量分析。

代谢组学主要以小分子代谢物(相对分子质量<1000)为研究对象,利用高精密度的分析方法和化学计量学的处理方法来研究生物体在遗传、环境或是外界物理、化学刺激等情况下机体的反应和变化。目前,代谢组学技术已被初步应用于糖尿病发病风险的相关研究,具有广阔应用前景[6]。

代谢组学检测所采用的质谱法是目前用于鉴定和分析化合物分子最为有力的工具之一,其中包括蛋白、多肽、代谢物、糖等,分子的定性定量分析、化学式的确定及结构鉴定等。质谱是一种电离化学物质并根据其质荷比(质量-电荷比)对其进行排序的分析技术。简单来说,质谱就是检测样品内的分子质量。质谱法被用于许多不同领域,并被用于纯样品和复杂混合物的分析。

通过高通量质谱检测平台获得糖尿病队列及正常对照队列血清中的代谢物信息,建立疾病代谢组数据库。采用非靶向代谢组技术对比实验组与对照组,应用超高分辨质谱检测样本中所有代谢物,并获取定量信息,找到不同组别之间的差异代谢物和代谢通路,可为疾病生物标志物开发,疾病发病机制和疾病大数据等研究提供线索和方向[7]。针对Ⅱ型糖尿病相关的生物标志物进行有针对性的检测,以标准品为参考,利用多反应监控(MRM)技术对目标生物标志物进行准确的定量分析。相对全代谢组,具有特异性强、灵敏度高和定量准确等特点[8]。

对获得的代谢组大数据进行人工智能建模、机器学习及优化,构建出Ⅱ型糖尿病发病风险评估模型。通过代谢组检测技术和人工智能大样本特定疾病人群深度学习,对影响人体健康的重大慢病进行分析,全面解读糖尿病发病风险[9]。只需要极少量的血清样本,即可采用代谢组质谱检测平台和人工智能大数据分析平台,建立个体的代谢组画像,精准评估Ⅱ型糖尿病发病风险,对延缓或避免疾病的发生具有非常重要的应用价值和意义[10]。

根据代谢组检测结果,通过人工智能技术对大样本特定疾病人群进行深度学习比较,科学地量化评估出健康状况,预测Ⅱ型糖尿病的发病风险。在此基础上,按照三级预防原则,针对是否存在疾病高发病风险给予相关的预防措施或为临床干预提供精确数据。依此提供精准的个体化健康服务,最大限度地延缓和避免疾病的发生,更好的实现个体化的精准预防、诊断与治疗,提高健康水平。

传统诊断方法相比较,基于代谢组和人工智能大数据解读的疾病量化预警具有更高的灵敏度和特异性,适用于更早期阶段的疾病风险预警。采用机器学习、深度学习等人工智能技术,在人群样本大数据中识别解析各种重大慢病指纹图谱与风险因子,对目前可能的疾病状态、疾病通路、及发病概率进行精准风险评估[11]。

代谢组学目前与糖尿病发生相关的生物标记物主要集中在氨基酸(其中包括支链氨基酸、芳香氨基酸等)、脂肪酸(游离脂肪酸、长链脂肪酸)、脂质(磷脂等)、有机酸、糖类等代谢产物[12],少部分涉及核苷酸、酰基肉碱等,其涉及的代谢通路主要包括氨基酸代谢、能量代谢、脂肪酸代谢等,均与糖尿病发病高度相关,例如,支链氨基酸的代谢已经公认与糖尿病潜在风险有密切关联,其机制主要与机体胰岛素的敏感性密切相关[13]。支链氨基酸积累可以激活哺乳动物雷帕霉素靶向基因复合物1(mTORC1),进而影响下游靶核糖体蛋白S6激酶1(S6K1),从而影响机体对胰岛素敏感性。这一调节有效证实了糖尿病发病与机体氨基酸代谢失常存在密切联系[14]。

通过代谢组质谱分析技术及人工智能大数据解析技术,解析出不同性别和年龄的健康人群、亚健康人群、疾病人群相关因子之间的差异、代谢通路的变化,并分析各类因子与不同疾病之间的内在联系,整合代谢组检测、个人生活方式、健康状况、家族病史及临床检查等信息产生数据集,借助人工智能疾病风险预测模型检测运算,对糖尿病发病风险进行科学预测,实现早发现、早预防、早治疗[15]。

六、前景及展望

糖尿病是由环境及遗传因素共同引起的代谢紊乱性疾病。糖尿病一旦发病,机体代谢便易处于紊乱状态,患者表现出多饮、多尿、多食、体重减轻(消瘦)的“三多一少”症状,而发病后期更易遭受各种并发症的困扰。目前,全球糖尿病发病率增长迅速,糖尿病已成为第三大威胁人类健康的慢性疾病,所以早期发现糖尿病意义重大。糖尿病常常隐匿发病,代谢组学高通量检测技术的发展、人工智能大数据解析能力的进步,使得早期预警Ⅱ型糖尿病发病风险成为可能。

目前的Ⅱ型糖尿病健康管理,依据静态指标,但当指标真正有问题的时候,往往已处于疾病状态。而根据个体代谢组健康画像,通过人工智能预测Ⅱ型糖尿病发病风险指数和风险等级,提醒个体若不积极采取健康管理干预措施,未来可能进入某种疾病队列,为个体主动健康管理提供数据基础。不仅有利于加强疾病预防、提高慢病管理效率,也能提升公众的健康观念,从根本上节省全社会的医疗成本。

参考文献

1. Ogurtsova K, Da Rocha Fernandes JD, Huang Y,et al. IDF Diabetes Atlas: Global estimates for the prevalence of diabetes for 2015 and 2040 [J/OL]. Diabetes Res Clin Pract, 2017, 128; e40-e50. 2017-03-31 [2017- 04-07]. https: //www. ncbi. nlm. nih. gov/pubmed /28437734.

2. 康继宏,宁光,吴家睿,等. 中国糖尿病防治研究的现状和挑战[J]. 转化医学研究(电子版), 2012; 2(3): 1-24.

3. Nicholson JK, Lindon JC, Holmes E.‘Metabonomics’: understanding the metabolic responses of living systems to pathophysiological stimuli via multivariate statistical analysis of biological NMR spectroscopic data[J]. Xenobiotica, 1999, 29(11) : 1181 -1189.

4. Theodoridis G, Gika HG, Wilson ID. LC-MS-based methodology for global metabolite profiling in metabonomics/metabolomics[J]. Trends Anal Chem, 2008; 27(3): 251-60.

5. Marchand J, Martinean E, Guitton Y, et a1. Multidimensional NMR approaches towards highly resolved, sensitive and high-throughput quantitative metabolomics[J]. Curr Opin Biotechnol. 2017.43:49-55.

6. Bittremieux W, Tabb DL, Impens F. Quality control in masss pectrometry-based proteomics. Mass Spectrom Rev. 2018 Sep; 37(5): 697-711.

7. Eliuk S, Makarov A . Evolution of Orbitrap Mass Spectrometry Instrumentation. Annu Rev Anal Chem (Palo Alto Calif). 2015 ; 8:61-80.

8. Bajaj A, Sethi A, Rathor P, et al. Acute Complications of Myocardial Infarction in the Current Era: Diagnosis and Management. J Investig Med. 2015 Oct; 63(7): 844-55.

9. Boateng S, Sanborn T. Acute myocardial infarction. Dis Mon. 2013 Mar; 59(3): 83-96.

10. Mehta RJ, Gastaldelli A, et al. Mechanism of Action of Inhaled Insulin on Whole Body Glucose Metabolism in Subjects with Type 2 Diabetes Mellitus. Int. J. Mol. Sci. 2019, 20(17), 4230.

11. Qrgaard A, Jepsen SL, Holst JJ. Short-chain Fatty Acids and Regulation of Pancreatic Endocrine Secretion in Mice. Islets. 2019 Aug 30: 1-9.

12. Drawz P, Rahman M. Chronic Kidney Disease. Ann Intern Med. 2015 Jun 2; 162(11): ITC1-16.

13. Wang S, Lv D, Jiang SH, et al. Quantitative Reduction in Short-Chain Fatty Acids, Especially Butyrate, Contributes to the Progression of Chronic Kidney Disease. Clin Sci (Lond). 2019 Aug 29.

14. Paul BJ, Anoopkumar K, Krishnan V. Asymptomatic hyperuricemia: is it time to intervene? Clin Rheumatol. 2017 Dec; 36(12): 2637-2644.

15. Yang WX, Ma Y, et al. Prevalence of Hyperuricemia and its Correlation with Serum Lipids And Blood Glucose in Physical Examination Population in 2015-2018: a Retrospective Study. Clin Lab. 2019 Aug 1; 65(8).