第1章 在我们治愈坏血病之前

基因并不是决定命运的全部因素

GENETICS ARE NOT DESTINY

我们对一个人了解多少呢?如果你穿越到古希腊时期,问希波克拉底这个问题,他可能回答得很简单:这个人体温是高还是低,体型是高大还是矮小,是活着还是死亡。但是,如果今天你问一位医生,他给出的答案就会复杂得多。如今有数千种医学检测手段,可以对一个人进行从内到外的全面检测,如血液化验、尿液分析、X射线、多普勒检查等。我们可以使用各种系统,以及埃波克拉底(Epocrates)这类强大的医学参考应用程序,在线追踪检验结果。我们还可以进行基因组测序,也可以追踪一个人一天走了多少步。

将对一个人的所有观察信息进行分类十分重要,因为我们需要把它们当作解决患者问题的参考数据。无论是在古代还是在现代,这些观察信息都有不同程度的可信度和准确性。例如,医生对患者的行为和情绪的观察已有数百年的历史,而现在,我们可以利用电子设备对这些要素进行监测。这种方式既便捷又可靠,避免了人工观察的偏倚和耐力限制。当然了,希波克拉底也能计算一个人一天所走的步数,但是他计算的结果一定无法与现代运动计步器的精确度相比。

分类的第一步来自多数人在高中生物课上学到的知识:区分基因型和表型。在19世纪生物学家孟德尔利用豌豆的外貌特征进行实验之前,人类对遗传学几乎一无所知。直到大约70年前,詹姆斯·沃森(James Watson)和弗朗西斯·克里克(Francis Crick)通过对DNA的研究,揭示了基因信息是如何被储存和传递给后代的。由此,我们才开始理解遗传的机制。不过,虽然基因组在决定我们的健康状况上起着极其重要的作用,但它只是整个研究的起点。

相对而言,表型则包含了所有不存在于DNA编码中的人的可观察特性。一个人所有的特性以及他在世界中存在的方式,都属于表型的范畴,如头发的颜色、瞳孔的颜色、身高、体重等。对表型的观察甚至在希波克拉底时代之前就已经开始了。比如,古代的医生只需要用手触摸就能判断一个人是否发热。对于这种情况,我们应该称他们为“治疗者”,而不是“医生”,因为在医学被定义为一个结构化学科之前,人们可能就已经开始检查体温与治疗发热了。

这种观察方式至今仍在使用。比如,父母通过触摸孩子来判断他们是否发热,这类观察无疑属于针对表型的范畴,而我们的思维活动(认知),以及它们如何表现在我们的日常行为中,也都是表型的一部分。

随着时间的推移,测量表型的精确度不断提高。最初,人们通过触摸来检查人体是否发热,后来这一方法被体温计取代。现代的水银体温计或酒精体温计可以精确到0.1℃。37.0℃被广泛接受为健康人体的正常体温。就现代的体温计而言,这个温度可以与37.1℃或36.9℃区分开来。而数字体温计可能更精确,能够精确到0.01℃甚至0.001℃。

这些数字化的读数呈现出更高的分辨率,是用来区分表型的另一个有用的维度。没有经验的人可能只能区分两种体温状态:没有发热和发热。熟悉计算机语言的人可以用二进制的0和1来表示这两种状态。有经验的护士、医生或父母能区分低热和高热,再加上低体温症(体温过低以至于无法正常进行生理活动),我们就得到了4种可能的测量结果。懂计算机的人会意识到,这不再是一个二进制位,而是两个数字位,每一位都可以是0或1。如果我们想知道患者是否正在从发热状态(或低体温症)中恢复,可能需要使用液体体温计,以更精确地测量患者的体温。这样就能随着时间的推移,看到患者体温发生的具体变化。

在处理更复杂的疾病诊断问题时,如预测生育能力,我们可能需要更加数字化的方式。随着测量变得越来越准确,我们也需要越来越多的二进制位来存储这些测量结果,因为生物学与数字技术的融合,是与测量表型的精确度的提高紧密相连的。

从纳米到兆米

除了分辨率或精确度,我们还可以从尺度的角度去思考在一个人身上可获取的信息。首先,从微观层面来看,单一的原子组合形成了分子,这是我们目前能观察到的关于健康状况的最小单位。有前瞻性的人或粒子物理学家可能会预测,在未来可以利用亚原子级别的相互作用来预测和管理健康。这的确是有可能的,但是就目前而言,原子仍是我们在医疗领域可以观察到的最小单位。

我们可以从尺度在纳米水平的DNA开始观察。当基因处于开启状态时(引发一系列可观察表型反应的第一步),它们会被转录成RNA。这个过程仍处于纳米水平。最终,这些基因会指导身体合成蛋白质、蛋白质复合物和细胞器,我们到达了下一个尺度的里程碑:大小为数十微米的细胞。图1-1描绘了表型尺度的演变过程。

图1-1 不同尺度的表型

接下来是厘米水平的器官。如果我们研究一下历史上表型的测量方式,就会发现,对数代人来说,器官都是可观察到的最低水平。据说,公元前300年左右的希腊解剖学家赫洛菲勒斯(Herophilus)是第一个进行系统解剖并逐步理解人体的人。(3)他对心血管系统、消化系统、生殖系统等进行了详细的描述。

有些令人尴尬的是,2 000多年后的今天,赫洛菲勒斯的成果仍在很大程度上决定着我们对医学专业的划分。医生要进行脑、心脏、肝脏等身体器官方面的专门研究并接受专业训练,也就是说,医学中的学科研究基本上仍然是以器官为基础的。如今,随着具有影响力的观察和医疗干预发生在更小尺度的层面上,更小尺度层面专业化的必要性变得显而易见。当然,这并不是说某一个尺度比其他尺度更重要。毫无疑问,大脑及其复杂性完全值得我们针对其单独进行研究。但是,当我们观察癌症,以及纳米水平和微米水平的相互作用如何决定哪种治疗方式对不同的患者最有益时,分子、生物通路以及使我们能认识到癌症并非一种疾病而是多种疾病的专业化,都将变得至关重要。

保罗·赫尔林(Paul Herrling)教授曾在学术界和工业界担任多个重要职位,包括诺华制药的研究主管,以及Medidata公司的科学顾问。他告诉过我,进化是药物研发者的盟友。他的意思是,一旦身体中的分子机制通过进化过程表现出来,它们就会一次又一次地被重复使用。它们会在不同类型的细胞和不同的器官中执行相同的功能,有时还会执行不同的功能。这是生命科学家应该牢记的一点。这也意味着,一种对于治疗特定疾病特别有用的药物,可能在其他疾病的治疗中发挥其他作用。

试想一下,如果你没有任何工具,但你想要拧紧某款冰箱上的某个螺栓,你会怎么做呢?这听上去略显荒诞却相当有启发性——你最终会设计出一个能完成这项任务的工具,这就像研发一种药物来治疗某个器官中的某种特定癌症。根据螺栓的大小,你所创造的工具也能够拧紧(和松动)许多其他款型冰箱上的螺栓,甚至能用在其他许多物品上。同样,如果一种针对特定癌症的治疗方法能在某个病例中起作用,那么它也有可能用于治疗其他类型的癌症以及非癌性疾病。

我们再将测量的尺度扩大到身体的大小,也就是以米为单位。此时我们会发现,自人类诞生以来,人类能察觉的大部分事物一直都存在:人类的情绪可以被观察,人类的认知可以被测试,人类的行动可以被追踪。然而,从前这些表型都不能像现在这样被真正精确地测量。如果我们再扩大测量的尺度,不仅计算我们每天所走的步数,而且观察我们的认知如何驱动我们的行为,如去哪里、做什么,那么我们就会进入以千米为单位的尺度。有时,这个尺度甚至可以达到数百千米或数千千米。当我们再次扩大测量的尺度时,我们的思考或行为有时可能会影响整个社会、整个国家,乃至整个世界。

我们应该对这些不同层次的观察、不同的测量尺度保持开放的态度。我们需要看到比现代医学经常关注的基于器官的分类更小和更大的东西。西奈山健康系统(Mount Sinai Health System)精准医疗执行副总裁兼西奈山伊坎医学院(Icahn School of Medicine at Mount Sinai)遗传学和基因组科学副教授乔尔·达德利(Joel Dudley),在2016年Medidata的一次活动中谈到了这一点。他解释道,人类是一个复杂的适应性系统,我们不能仅通过察看局部来理解整个人。(4)

达德利说,根据症状和解剖结构来组织研究,就像通过阴影了解世界一样,是不正确的。我们必须利用数据重新定义我们对人类疾病的理解,这是至关重要的。比如,我们需要清晰地看到脑部疾病和皮肤病之间的交集。达德利坚定地认为,我们对身体系统之间的关系,以及由此对疾病之间的关系所做的假设,都已过时且不正确。他说,我们甚至还没有真正开始定义到底什么是健康。今天,健康被粗略地定义为没有疾病。而事实上,健康的真正含义有待进一步确定。

如果我们思考自赫洛菲勒斯以来的医学历程,会发现,实际上仅在几百年前,人类才开始在细胞层面上看待事物,这要归功于显微镜的发明以及对人体内微小构造的发现。在安东·范·列文虎克(Anton van Leeuwenhoek)于17世纪晚期观察到第一个活细胞和1839年现代细胞理论的发展(让人们意识到身体中的一切都是由细胞构成的)之间,临床试验开始出现。(5)从那时起,人类才真正开始构建关于身体是如何工作的客观知识。

坏血病疗法的启示

1747年,英国海军的外科医生詹姆斯·林德(James Lind)在看到一位又一位水手死于坏血病(在1740年的一次航行中,1 900名水手中有近3/4的人死于该病)后,决定尝试6种治疗方案。(6)他为6对病重的水手配制了不同的“药物”——醋、苹果酒、芥末和大蒜、海水、硫酸,而给另一对水手提供了两个橙子和一个柠檬。(7)最终,在这些水手中,只有食用橙子或柠檬的水手恢复了健康。(8)林德记录了他的发现,这被认为是历史上第一次有记录的临床对照试验,也同样经受了时间的考验。然而有趣的是,林德误解了自己的试验结果,他认为坏血病没有任何治疗方法,问题出在环境和饮食上。又过了50年,给水手们常备柑橘类水果,才真正消除了海上坏血病的问题,至少在有正常的水果供应时是这样的。

其关联性在于,正如我们一直以来在不断了解更多关于人体的知识一样,我们也一直在学习如何测试我们对人体的假设,如何开发有效的治疗方法,以及如何进行优质的科学研究。林德开始时的假设是零假设(9):假设他给水手们的任何东西都不会改变他们的病情。而他的试验结果证明他的零假设是错误的。

这是设计良好科学实验的最基本原则,也是我们今天在处理精准医疗相关问题时必须做的。零假设告诉我们,开始时要假设我们所测试的内容没有统计学意义。我们需要设立如下假设:取多个观察结果,包括基因型和不同分辨率的表型,然后将它们结合起来预测疾病的发生、开发有效的治疗方法和任何有用的预防措施,并不会给我们提供额外有价值的信息。最后,就像林德一样,我们需要证明这个零假设是错误的。这样,我们就可以证明患者方程式的实用性,并确认它们在未来医学中的价值。

在本章和后面的章节中,我会讨论所有可能的新的数据来源、所有我们一直忽视的各种零碎信息,以便将它们纳入我们一直试图进行的高质量科学研究中。当然我们并不是有意忽视它们的,而是因为我们根本无法衡量它们,至少无法持续或严谨地衡量它们。然后,从零假设开始,我们的任务是找出那些真正具有附加价值的因素。我们需要确定可测量的新表型,以及它们能与传统表型和基因型测量产生何种组合,这将切实地有益于我们对疾病的理解,并证明这些新表型的重要性。

自林德时代以来,人类对人体的认知已经有了长足的进步,但仍然需要指出的是,我们的临床试验方法基本上没有发生太大的变化。过去没有完善的基础设施、网络连接和足够的信息,可以让我们以不同的方式思考研究方法,而现在我们已经具备了这些条件。我们可以从更多维度深入地了解人体,奥秘就在于找出这些维度中哪些是真正重要的,以及它们的重要性体现在哪里。但是在这之前,让我们先回顾一下历史……

基因型的局限性

1953年,沃森和克里克发现了DNA的结构,开启了现代遗传学的新纪元。这是一个重大发现,它将提高我们预测和治疗大量疾病的能力。在我看来,我们常常错误地认为,基因型是我们能获得的一个人最重要的信息。20多年前,当人类基因组测序看起来可以开始大规模地处理任务时,人们轻率地认为,人们将能理解并治愈所有疾病了。人们认为,所有的一切信息都将存在于我们DNA的核苷酸中,即腺嘌呤(A)、胞嘧啶(C)、鸟嘌呤(G)和胸腺嘧啶(T)。我们只需要解码它们,就能迎来长寿和健康的未来。

1997年的电影《千钧一发》(Gattaca)将当时社会中正在出现的基因决定论思想呈现了出来。(10)电影中有“完美人”和“瑕疵人”两种人,前者的基因被精心设计至完美,后者的基因则任由其自然发展。完美人是特权阶层,而瑕疵人被边缘化,被剥夺机会,无法进入最好的学校和获得最好的工作岗位,几乎在所有方面都被认为是劣等的。然而在电影的结尾,如同许多好莱坞电影的结局一样,瑕疵人证明了自己才是更优秀的人……但这不仅仅是一个好莱坞式结局,也非常真实地说明了基因只能带人走这么远。电影中主人公的驱动力——他的认知及其引导的行为,在主人公的一生中证明了他成为宇航员的能力远比他出生时的DNA组成更为重要。

毫无疑问,基因型对我们身体的正常运行和整体健康非常重要。实际上,它是关于作为生物体的我们最重要的单一信息来源,也几乎是我们构成从分子生物学到行为学所有方面的主要基础(尽管不是唯一的)。DNA序列中的单一变异可能会导致泰-萨克斯病等致命遗传病,而点突变可能会导致癌症。然而,如果我们从数学的角度看待我们对基因型与表型知识的掌握程度,以及它们随时间的推移产生的相对变化(见图1-2),我们就可以开始理解为什么以及在何种情况下,表型的重要性超过了基因型。

图1-2 个体基因型和表型随时间变化的情况

如图1-2所示,尽管一个个体的表型会变得越来越丰富,且随着时间的推移,个体会积累越来越多关于自身的信息,但他的基因型却从未发生变化。从生命初始阶段开始,周围环境在将个体始终稳定的基因型转化为远比单一的DNA序列复杂得多的生物体方面,起着至关重要的作用。个体始于一个单细胞受精卵,然后分裂成两个细胞。这两个细胞中的一个最终会发育并成为头部的一部分,另一个则会发育成为脚。产生这种分化的最重要因素是受精卵内部的局部化学环境。

形态发生素是一种在细胞中以不同浓度存在的信号分子,它们是细胞分化的关键。在最初的受精卵中,形态发生素的浓度梯度(相对较高和较低的浓度水平差)及随着细胞持续分裂的相对浓度,决定了人在发育过程中身体前后、头足、内外的轴线。自此,环境之于个体内外的影响会变得越来越重要。

或许,下面这种说法有些极端:在你一生中的任何时刻,我从你的DNA(基因型)中获取到的关于你健康状况的信息,并不会多于当你还处于受精阶段时获得的信息。实际上,这种说法也并不是完全准确的,因为随着时间的推移,基因会发生突变。当一些细胞自然凋亡,其他细胞分裂和生长时,突变的增多可能会导致严重的疾病。但是,如果我们观察生命最初的DNA,也就是我们从父母那里继承的种系,就可以从中推导出一些信息。基于这些信息,我们可以预测哪些疾病可能会在我们一生的不同阶段影响我们。但随着时间的推移,这些推导和猜测并不会变得更加精确。因为在身体内外环境的变化下,包括生活在体内和体表的所有有机体——微生物群的基因型、堆积的表型、表型的影响以及它们如何演变都会对我们的健康状态产生极大的影响。

我们曾以为,遗传学能提供确定的判断,让我们从中获取有关自身的重要信息,无论这些信息是正常的还是与疾病相关的。但是,我们越来越清楚地意识到,事情并没有那么简单。的确,我们知道某些特定的基因或基因组合与多种癌症有关,但复杂的生物机制告诉我们,单纯从基因角度来看待健康问题过于简单化。这种复杂的生物机制,包括通过多层反馈回路开启和关闭不同的基因、错综复杂的生物通道、细胞间的通信,以及我们可以考虑到的各个层面的复杂性。甚至,单纯地讨论基因的开启或关闭状态,同样忽略了生物机制的复杂性,因为任何时刻体内都可能发生产生大量蛋白质或没有产生蛋白质的情况。正如斯坦福大学的研究者所写的,特征、状况和疾病都是“全基因”的。(11)基因确实重要,但是对某种病症而言,有太多的基因发挥了作用,试图追溯到一组特定的基因是徒劳的。

总的来说,虽然遗传信息可以丰富我们的疾病模型,但一个好的疾病模型需要的远不止这些。我们需要将遗传信息与我们的生理数据、行为数据,以及关于活动、睡眠和情绪的信息结合起来。而我们直到近10年才真正大规模、客观地测量这些信息,但它们确实可以丰富我们关于人体内部发生情况的模型。

我们可以这样思考:把人体的遗传信息及所有其他信息看作某个公式的输入,而这个公式输出的是关于人体的健康状况,以及应该接受或避免什么样的治疗的实用报告,这就是关于精准医疗的全部内容。我们可能都在走向临床痴呆的道路上。但在深入了解精准医疗时,我们要记住,基因并不是决定命运的全部因素。许多因素都可能影响我们是否会患有某种特定疾病或症状,或者至少影响某种疾病或症状发展成需要治疗的问题的速度。在一定程度上,只要我们知道如何寻找这些因素,它们都是可以被观察到的,甚至在某些情况下,它们会在我们的控制之下。这些因素包括我们吃的食物、我们居住的环境,任何我们现在可测量到的、即将能测量的事物,以及尚未被发现,但只要能确定它们是什么就能测量的任何事物。

高频医疗设备

上文提到,有史以来,我们终于可以第一次大规模、客观地测量海量的信息。我认为,这与赫洛菲勒斯、列文虎克、沃森和克里克的突破性发现同样重要。现在我们生活在一个到处都是传感器的世界中,我们可以利用它们对我们的生理、认知和行为进行前所未有的测量。当我写这篇文章的时候,我戴着一只手环和一个心率贴片。你可能没有,至少在你读完本书并意识到你也应该戴上之前,你还没有。但我敢打赌,你的口袋里、你的桌子上或你能触及的地方,一定有一部智能手机。这部智能手机和正在追踪我的心率、体温、实时心电图并实时将它们上传到云端的心率贴片一样,都是高频医疗设备。

这类设备不断为我们提供更多关于人类的信息,我们可以利用这些信息做出更好的治疗决策,并完善疾病模型。过去,医生主要依据生理特征来诊断疾病,如体温、肤色,以及皮肤是湿热还是干冷。但是,当我们将血液化验纳入考虑范围后,治疗决策的可靠性可能会提高上百倍。在引入影像学诊断后,如X射线、CT扫描、磁共振成像等,我们现在可以诊断癌症并对其进行分期、查看器官等,诊断的准确性可能会再提高百倍。现在,我们还可以利用一些传感器更方便、更快速地完成诊断,如实时连续地测量体温、血压、血糖等,而无须像过去那样,只能找医生或去医院进行诊断。另外一些传感器则可以测量我们以前未曾考虑过的数据,如我们一天所走的步数或去过的地方。

我们可以从两个方面来思考传感器及其所依附的设备,至少过去我们是从这两个方面来思考的。

一方面,我们有医疗级设备和消费级设备。过去,一支体温计约30厘米长,需要20分钟才能得到读数,它们笨重且难以携带,因此人们只能去诊所中测量体温,不能在家中测量。显然,现在这种情况已经发生了改变。同样,血压、血糖监测,以及几乎所有其他检测都遵循相同的发展路径。现在,医生可能会让患者戴着动态心电图监测器回家,也有了可以在睡眠实验室外分析睡眠状况的设备,等等。

另一方面,我们有低频设备和高频设备,能进行断续测量与连续测量。例如,我的手环可以测量我走的步数,这是一种低频数据;而我的心率贴片可以测量我的心率,这需要更多更精确、更高频的数据。如今,它们之间的区别越来越不重要了,每一个低频设备内部基本上都有一个高频设备。例如,我的手环内的芯片比20世纪60年代用于将人类送上月球的加速度计更先进。过去仅提供给医疗系统使用的设备现在已经开始面向消费者出售了,而且那些还未对外开放的设备也将很快面向消费者进行销售。所有拥有智能手机的人,包括那些对我佩戴的手环和心率贴片嗤之以鼻的人,都在使用一款高频设备,它能测量我们以前无法测量的生理、认知和行为数据。

因此,与历史上任何时期相比,我们现在都能更方便、更客观地测量事物。但是,我们应该测量什么呢?为什么要测量它们呢?我们应该如何利用这些新的数据流,并将它们纳入已经存在的疾病和诊断模型中呢?换句话说,智能手机等设备是如何影响生命科学领域的呢?为了回答这些问题,我们需要首先探讨所谓的精准医疗和患者方程式到底是什么。