基因黑客 碳云科技
- 来源:快公司 smarty:if $article.tag?>
- 关键字:碳云科技,华大基因,健康 smarty:/if?>
- 发布时间:2016-01-27 17:56
从工商登记注册时间来说,成立于2015年10月19日的深圳碳云智能科技有限公司(以下简称“碳云科技”),毫无疑问是家刚刚呱呱坠地的初创企业,但几乎没有人会怀疑这家公司的雄心。
人的名,树的影,声名与影响力,有时就是这么简单——碳云科技方才成立即名声大噪,是华大基因前CEO王俊与同样在华大基因创立过程中起到重要作用的原首席运营官吴淳、首席科学家李英睿、首席信息官黎浩等几人创立的。
事实上,无论是再度创业的王俊,还是他的几位拍档,均对新公司的目标之远大不遮不掩。
“一个未来可以影响到人类和健康的更根本和更前瞻性的事业”,王俊如是说。
1 生命程序员
要画出这幅以“人类与健康”为画布、“更根本和更前瞻性”为色调的宏大画卷,需要的颜料之一是生命的基因程序。
碳基本身的智能一直在变化中,如果把生命本身看作是一个程序的话,每一个个体都在运行不同的生命程序,而它们的功能模块基因互相之间是一脉相承的。由此,千姿百态的生物在碳云科技的几位创始人的眼中,更像一段段代码,“我们看到大千世界的每一个物种,实际上都有一个生命程序。不同的生命程序随着生存环境的不同变化,程序适应生存环境的策略也在改变。每一个人不一样,每一个物种也不一样。”
跟计算机的程序一样,生命隐含的这套程序也是可以被读出来的——十六年前华大基因的成立,就是为了解读第一个人类基因组的全部基因图谱。这意味着每一个人的生命天书,可以以数字化的形式展现在计算机里面,因为DNA是全世界现在最高效的一种信息化载体。
作为人类基因组最多产的测序者,华大基因通过技术进步大大降低了全基因组的测序成本,从2003年的3亿美元快速降到数千美元且逐步下滑,其前景一度被描述为系统化世界的生物信息并将这些信息向人们开放——就像生物界的谷歌。
正是在这不断的测序过程中,王俊们充分地体会了这种载体的计算机特征,从DNA的拷贝——克隆作为最简单的拷贝器可将一个DNA完全拷贝和复制到另外一个DNA上,到基因的编写、修改乃至合成,条件到位的情况下,统统都可以完成。
换句话说,你可以把基因科学家们理解为解码生命的程序员。事实上,热衷于用各种计算机术语来描述自己所作所为的基因领域人士越来越多。
以Counsyl为例,这家拉姆基·斯里尼瓦桑(Ramji Srinivasan)和埃里克·埃文斯(Eric Evans)以及里希·卡克(Rishi Kacker)——都是斯坦福的同事——于2009年成立的公司,对基因测试结果的数据进行筛选时,参照最多的想法都来自硅谷。
“一开始,我们就将自己定位为软件公司,”拉姆基说。
2 长生黑客
机器人小心翼翼地处理着唾液样本。它们对大量盖着橡皮帽的小试管进行有序排列,并将其放在倒插的针头下。一只机械臂将某些试管从一条自动传送带移至另外一条,最终,这些试管都被装进一个盒子状的小装置,该装置唯一的任务就是猛力摇晃里面的东西,将病人的DNA从唾液中分离开来。这正是将近200个机械组件所做之事:从生理分泌物中提取宝贵的基因信号。
位于南旧金山机械实验室中的这些自动化员工是Counsyl的核心,若换成人力,同样的工作需要100个人来完成,所需面积更要多上4倍。这也是为何Counsyl基因测试的收费比竞争对手低7成的原因。
对比花几百美元接受Counsyl服务的几十万普通用户来说,王俊掌握自身的基因状况显然不知要强多少倍。
王俊坦言试过不同的检测手段,从自己的基因图谱中发现过一个痛风基因的携带,又在进一步基因解读中发现尿酸代谢有些缺陷,“尿酸代谢的缺陷需要去弥补,找来找去找到了一种茶——牛蒡茶,这种茶我天天喝,喝了以后可以帮助我体内的微生物弥补本身的尿酸代谢缺陷。3个月之后,我的尿酸恢复了正常水平。”
这种针对基因层面缺陷采取的手段,有点像玄幻小说中的洗髓伐骨,几年前还是极少数人才能有的体验,但在未来却可能常态化。
事实上,当越来越多新型基因公司,以过去想象不到的低廉价格提供基因测试数据,基于高价格赢利的老牌基因公司在逐渐丢掉市场份额时,一些激进的初创企业不但尝试让你掌握基因的某方面缺陷,并已经在一些特定方向有相当高的成功率了。
2011年前,多至1/3的甲状腺活检结果都显示不确定,结果,许多本无问题的病人也要被迫切除甲状腺。这时,分子诊断公司Veracyte的首款产品出现了,该产品可测量活检样本上142个基因的表达以确定甲状腺结节是否为良性,大大减少了不必要的手术。
2014年底,Veracyte成功说服保险公司将甲状腺检查列入参保范围。“有人做科学研究,发现了可能有用的结果,许多公司也因此创立了,”2013年成功带领Veracyte上市的邦妮·H·安德森(Bonnie H.Anderson)说,“科学推动产品。但问题是,产品不一定符合临床需要。我们则相反,先认识到临床需求,再反过来寻求科学支持。”
23andMe的设立初衷是直接告知客户他们是否有患上帕金森或阿尔茨海默等病症的倾向,而Counsyl仅专注于公司所说的“临床可行动数据”,即让人们马上进行直接治疗的信息,包括孕前检查你是否100多种可遗传疾病的携带者和你患上乳腺癌、卵巢癌和前列腺癌的几率有多高。
“基因的研究让我们可以控制很多疾病,比如地中海贫血或很多先天性的缺陷,包括白化病以及各种各样的缺陷,甚至一些非常稀有的疾病,这些七七八八的疾病会逐渐因为基因和疾病之间的关系再次被解读,”但王俊认为,尚待解决的问题远比已经解决的问题要多得多,“尽管我们现在可以用非常高效的方式解读每一个人的生命程序,但是对于生命和健康从来没有真正理解过。这个生命的公式,从基因到你最后所显示出来的生命状态,在这之间的生物学第一定律,从来没有被真正解读过。”
3 大数据修真
对于碳云科技来说,真正的解读至少可以在两方面做突破:基因本身的研究以及将更广泛的关联数据纳入思考范围。
以二型糖尿病为例,中国二型糖尿病发生率是11%,从二型糖尿病来看有40个跟糖尿病相关的基因动点,但目前解决的只有6%左右,绝大部分基因的遗传性是没有被完全认知的。再考虑到,30年前中国的糖尿病发生率只有0.67%,30年的基因不可能有大的改变,变化的是饮食、生活环境、生活方式。
换句话来讲,有可能这些变化引发了你的肠道微生物变化——肠道微生物是体内最重要的一种外环境。
这还只是糖尿病,更广泛地看,基因作为构建生命数据的基础,仅仅是一个基础的基线,要解决生命健康问题,需要更多基因的表达结构数据,所处的环境数据(包括肠道微生物这样的体内环境数据),甚至包括社交的数据、传感器的数据,包括各种各样你所能收集到的生命科学和生命体征的数据。
这也解释了碳元科技成立的第一阶段目标定为:打造中国首个专业度最高的百万健康数据收集平台,结合中国最强的生物科技和人工智能领军团队,通过数据挖掘和机器学习,将人工智能的优势带入海量的生命大数据分析和应用中。
对于几位创始人来说,好消息是,包括手机内置的传感器在内,越来越多种类的数据已经几乎覆盖到每一个人,只等这些数据与个人的基因图谱汇集到同一个平台上,生成关乎每一个人的生命大数据。
“这样的数据量能够达到百万级别、千万级别,海量数据的输入和输出将会成为未来健康产业的引擎。这种百万基因组计划,将会构筑精准医疗、精准健康和精准营养”,这样的前景非常诱人,但王俊恐怕得先端掉过去同行们的高额基因检测收入,“现在测定一个基因图谱需要一万块钱人民币,但我认为在现在的互联网情况下,每一个人检测自己的基因应该免费。在免费的基础之上,有一个非常重要的假设,就是在大量的数据积累之后,所有数据所能产生的价值将远远超过它产生这个数据所需要的成本。这点马上就会到来。”
这种美妙前景蕴含的可能,使王俊最近的几次演讲充斥着英雄色彩,“每一个人都是特别的,我们都是生命程序本身的超级英雄。在某种意义上,一个基因在这个人的个体里是疾病基因,可能在另外一个人的个体里面它没有关系,这时候那个人也许就能帮助这个疾病的个体。所有的基因连接起来,它会寻找到那个特殊的超级英雄,它会形成新的疾病治疗策略。”
