医学大数据重塑整个精准医疗体系

  医学大数据的架构具有很强的扩展性,在获取人体的基本数据以后,不仅可以构建人体的解剖结构和生理结构,而且可以从分子层面去构建微观模型。例如,基于一些复杂的数学模型,可以从DNA序列推演到mRNA结构,最后构建这段DNA序列表达的蛋白结构。近年来包括医学在内的多种学科不断交叉融合,学术界的交流以及创业公司都在努力推动多种技术的融合。在医学上不仅仅牵涉到临床医学,同时涉及生物学、分子生物学、细胞生物学、化学等等,以及自动化,包括检测、统计、分析、影像等方面都会涉及。当然,数学肯定是最基础的,建立数学模型、复杂的算法都跟数学基础息息相关。新兴的大数据即数据科学,也离不开基础的计算机科学。所以,未来医学是众多学科融合的综合科学,大数据的价值是众多领域量化的数据融合,这就是技术趋势。

  市场需求是重要驱动

  去解决实际临床问题更多依赖于医生的经验,不论是生理层面还是分子层面许多都还没有被完全的量化,而是记录在医生的经验当中。医院也已经采集到很多数据,存放在不同的计算机系统中,但是基本以数据孤岛的形式存在,并没有被充分利用和挖掘,而这些其实就是做基础研究最重要的数据。

  医学大数据发展有三大价值驱动力,首先是生活质量的提高,人们对生命质量或者是健康质量的不断追求和高标准的要求;其次是在高品质生命健康需求下促使成的生命科学技术的进步;最后是基于生命科学技术进步的临床手段不断丰富,临床治疗质量不断提高,这就是整个医学大数据价值驱动的核心。此外,巨大的患者人体组织器官替换的市场需求也是重要的驱动因素。

  整个再生医学行业的大背景是全球每年大概有8000多万的各种组织器官的需求,包括脏器器官、软骨、胰、颅颌面、眼膜等,目前只能通过捐献满足,而捐献所能满足的需求是非常有限的。所以,众多科学家希望可以获得除了捐献以外的方式来替代和满足大量的需求。脱细胞异体移植是正在研究的一种方法,即从供体上取出的组织脱细胞后,种植受体的细胞进行培养,然后再移植到新物体上。比如猪或牛跟腱组织取出来进行脱细胞处理,然后异体组织移植。自体移植的方法可能会造成二次创伤,而异体移植也可能因为分子层面未被认知的部分影响生物的生存。所以,眼下的科学家研究采用人工合成、天然高分子或者生物仿生等材料,构建人体组织器官的结构,如骨骼的结构,把细胞种植在上面,然后再做培养骨骼的移植,目前大量的实验证明这种方法是可行的。每个人的人体骨骼从头到脚的结构都不一样,不同骨骼的功能也不一样,有的是起支撑作用,有的是为神经和血管等提供营养供给载体,有的起保护脏器的作用。因此需要针对每个患者的骨骼等受损组织器官的微结构进行精准构建,而组织器官微结构的精准构建需要通过艾科赛龙进行精准的解析并构建,然后才能提供给临床去做治疗。在中国通过捐献方式获得器官移植的每150万人当中,只有1万例获得捐献,其余的因未能得到及时治疗而死亡。癌症、新发肿瘤、心脑血管疾病等患者数量,再加些意外创伤、事故等患者人数,再生医学技术的需求将越来越大,并且日趋紧迫。

  国内对精准医疗的理解主要是停留在基因层面上,而精准医疗的概念在外科领域最早被提出,精准医疗其实是针对个体化治疗的、针对个性化各器官的医疗服务。例如,骨组织的修复,完整的骨组织功能重建,需要匹配生理环境,这也是精准治疗的范畴。重塑精准医疗的整个流程首先是基础数据的采集,这是医学大数据的挖掘的基础,数据的采集方式很多,包括临床经验数据、自动化设备的影像数据(CT、MRI)、基因测序数据等。其次是数据的解读与分析,通过建立相应数学模型、采用机器学习等技术对医学数据进行挖掘。接下来是临床治疗和技术支持,把数据解读和分析的结果变成实用、落地的产品或方案,用于临床治疗或技术支持,如个性化解决方案、手术导航板及个性化植入物等。再者结合个性化治疗的量化指标,跟踪随访、复诊,形成精准医疗的闭环。最后,将汇聚众多的临床经验、数据进行完整的解析与融合,形成精准医疗完整的路径和思路,从而建立巨大的精准医疗系统。这个系统不仅包含外科,也会涵盖内科。借助这样一套巨大的系统,将骨骼等外科以及脏器等内科学所涵盖的组织器官量化解析,从数据开始重塑整个精准医疗体系。

  数据融合让结论更精准

  人体生理环境下各种数据是有相互关联性的,单个数据拿出来,如影像数据与血液的检测数据,与单个细胞或者干细胞是什么关系?在人体外的彼此间的关系不大,所以必须构建彼此之间相互关联的系统,模仿人体真实环境。搭建这样的系统涉及的数据非常庞大,通常需要通过多层的运算,应用较为普遍的人工神经网络。人工神经网络的架构与人体神经系统有些类似,通过计算机模拟神经网络的运行方式来构建,据说谷歌已经可以建立50到100多层的神经网络运算,而通常应用只有几层。在实际应用中,艾科赛龙没有建立那么复杂的关系,但会经过多个环节的处理以达到更好的效果。人工神经网络的单神经元通常由计算单元、连接单元和计算结果组成,再由多层神经元建立神经网络。计算单元对外面获取的信息进行计算,获得信息分配的权重,也是经验值,对计算结果再进行加权、综合等处理,经过多层的运算,就形成人工神经网络的基础架构。

  拥有海量数据和建立分析的系统架构后,利用相关专业的算法和分析的数学模型进行挖掘,从而获取最终结果。海量数据和庞大的工作量,需要有效利用计算机的计算与运算能力,通过机器学习和深度学习赋予计算机一定的智能,并结合人工神经网络实现自动化架构。

  建立这样一套架构的目的是要经过大量数据对机器进行训练,使得机器可以相对独立地计算与判断,并得出相对精准的结论。艾科赛龙做的骨科学领域,基于几万例的数据不断地对机器进行训练,机器现在可以独自进行计算与判断,并得出相当精确的结论。基于深度学习和人工神经网络架构运算,得出的数据和结果是结构化的。这个结果就是结合临床和医学,进行定量计算、结构解析、判别细胞毒性和癌症病变等,以及对肿瘤标识和药物筛选,甚至是组织构建和再生。所以量化与解析的目标就是解析人体的组织的微环境及微结构。骨骼结构可以看做脱细胞之后的物理结构,微环境就是组织生存的复杂的生理环境,最终的目标就是要解析组织的微结构和微环境,具体表现为细胞与细胞之间、细胞与组织之间、组织与组织之间的相互作用。例如解析血管的微环境和微组织,需要清楚认识血管细胞与构成管壁的肌细胞,甚至脂肪细胞之间的关系,即细胞与细胞之间的关系,以及组织与组织之间的关系,血管的毛细血管网络化以后,如何向组织渗透营养、输送营养等。最后将多领域的数据融合,经过缺失量化和精准构建,可以做到精确统计、精确预测,最终精确地输出一个产品或者是一个结论。

  再生医学技术是用医学、生物学、化学等多个学科与工程学相结合的方式,重新构建或修复人体或动物失去功能的组织、器官,使其具备正常的生理功能。具体包括多功能干细胞诱变、细胞迁移、组织再生修复,组织替代等。修复组织结构和生理结构以后,再生医学技术最终目的是要恢复生理功能。再生技术最重要的环节是干细胞,几种有代表性的干细胞定向诱变,如iPS、MSCs等在技术和实验中已经比较成熟。再生技术与干细胞的结合的路径首先是通过种子细胞培养获得组织细胞。然后通过对组织器官的精准解析和构建,并结合生物3D打印构造仿生的微结构和微环境。接着将培养的组织细胞与仿生微结构在微环境下进行活性的培养,激活构建的组织器官的功能。活性培养完之后就构建了具备相对完整功能的组织器官,从而可以继续进行临床治疗。经过整个过程的治疗,患者能够最大限度地恢复缺失的组织生理功能,从而真正提高患者治疗质量。

  ■深圳艾科赛龙公司创始人 赵小文

关注读览天下微信, 100万篇深度好文, 等你来看……