如初文学网

基因编辑 知乎小说

分类: 微小说  时间: 2022-09-29 03:16:10  作者: 大熊 
基因编辑 知乎小说

卡 bug,原本指利用程序漏洞实现某些本不应该做到的操作。理论上,只要是有代码的地方就有漏洞,有漏洞就必有人卡 bug,而这当然也包括承载了生命系统的 DNA 代码。接下来我要讲一个一群科学家挖空心思卡 DNA bug 的故事。

以 1953 年 DNA 双螺旋结构被发现为界线,生命科学被分割成了两个时代:在此之前,生命是一个具象的、最多用个显微镜就能一睹的现实世界;而在此之后,生命则越来越像是一个抽象的、由名为 DNA 序列的代码所构建起的虚拟程序。

最早的时候,人们对 DNA 工作原理的理解仅限于中心法则,DNA 先转录为 RNA,然后 RNA 再根据三联密码子法则,三个碱基对应一个氨基酸来翻译为蛋白质。

但很快,人们就发现是自己狭隘了,这些可以最终表达为蛋白质的 DNA 序列(大体上约等于我们日常概念中的「基因」),仅仅占生物全部 DNA 序列的不到 10%,它们相当于是 DNA 代码所构建起的宏大程序中的可执行文件(.exe),而大部分 DNA 序列更类似于一些辅助文件(.dll)。比如,决定在什么时候调用哪个 DNA 程序,如何为这些 DNA 程序分配资源等。

而到二十世纪八十年代,DNA 又一次刷新了人类的认知。

DNA 中的「数据库」

西班牙港口圣波拉(Santa Pola)美丽的白色海岸不但在数百年来吸引着无数游客,同时那里沿海的广阔盐沼也让此地成了世界上最优质的盐产地之一。而在这附近长大的弗朗西斯科·莫伊卡(Francisco Mojica)自然也是这片海滩的常客,可能就是缘于这份对故乡的留恋,当他于 1989 年在阿利坎特大学(The University of Alicante)攻读博士学位时,将自己的科研目光投向了一种从圣波拉的盐沼中分离出的古菌身上。

而也就是在这种古菌的 DNA 中,莫伊卡发现了一大段很反常的 DNA 序列,这是一种不断重复出现的由三十个随机碱基与三十六个固定碱基所组成,并具有一定回文结构的规律重复序列(Mojica, 1993)。

尽管纯粹的重复序列在 DNA 中不算少见,但这种由随机碱基与固定碱基轮流出现所组成的重复序列在当时却是独一份。

随着研究的深入,莫伊卡又不断在其他种类的嗜盐古菌中找到了这种类型的重复序列,甚至于他还在故纸堆里翻出了一篇 1987 年日本科学家的论文,表明大肠杆菌里面也有类似的重复序列。

莫伊卡的研究一做就是十多年,到 2000 年时,他已经在二十多种细菌和古菌中发现了这样奇怪的重复序列,但他依旧没明白这序列究竟有什么用,只能给它起了一个就事论事的名字「规律间隔重复的短片段」(Short Regularly Spaced Repeats)。

一直到 2003 年的一天,莫伊卡突然想到,他之前一直都聚焦于这个重复序列中固定碱基的部分,却好像一直不太重视其中随机碱基的部分,因为这些随机碱基好像真的是「随机」的,别说是在不同菌中,就算是同一种菌的不同个体都不太一样。但万一那其实不是如看起来的那么随机呢?

于是他摘录了好几百条随机碱基序列,将其与国际 DNA 序列库中浩如烟海的 DNA 序列记录作比对。随着比对范围的不断扩大,突然,他发现这些随机碱基序列居然可以和一类未曾设想的 DNA 序列完美匹配。

病毒!

一瞬之间,一个大胆的假说在莫伊卡头脑中闪现了出来。

在揭示答案前我先打个比方,比如你要记账,你可能会这么记:

支出 1:××××,×× 元;支出 2:××××,×× 元;……以此类推。

如果一个不识字的人看的话,这就是一段由随机字符「××××,××」和固定字符「支出」「元」轮流出现所组成的重复字符串。

这些由随机碱基与固定碱基轮流出现所组成的重复序列实质上是一种 DNA 程序中的数据库。确切地说,莫伊卡所发现的是古菌细胞中负责识别病毒基因特征的数据库。在自然界,古菌和细菌经常会受到各种病毒的侵袭,一旦它们从病毒的侵袭中幸存下来,就会像是记笔记一样把病毒的一部分基因特征记录下来,刻在自己 DNA 的病毒数据库中。

正所谓「菌子」报仇,十年不晚,如果下次同样的病毒还敢来犯,从这个病毒数据库中就会转录出大量的 RNA,被称为向导 RNA。这些 RNA 说白了就是病毒基因数据的抄本,相当于是印刷的通缉令。与此同时,细胞还会制造一种叫作 Cas 的蛋白质,这些蛋白质就像是一群警探,其中有些会和向导 RNA 结合,就像警探拿着通缉令一样以极高的效率照此拿人,精确切碎病毒的基因,从而实现对这种病毒的免疫。

莫伊卡发现的「规律间隔重复的短片段」后来有了一个更加著名的名字——「规律间隔成簇短回文重复序列」(Clustered Regularly Interspaced Short Palindromic Repeats),简称 CRISPR(Jansen 等,2002;Mojica 和 Garrett, 2012)。

莫伊卡迅速通过一系列实验证实了他的假说,然而他的理论实在过于惊世骇俗,《自然》杂志甚至都不愿意将其交给业内专家做同行评议。他后来又把论文投递给了《美国科学院院刊》《分子微生物学》《核酸研究》等一系列期刊,但无一例外全都被拒之门外。就这么不断被拒绝了快一年后,莫伊卡终于心态崩溃。他破罐子破摔地将论文投给了一个不知名期刊《分子演化杂志》,但即便这样还又改了一年多才发表(Mojica et 等,2005)。

然而,让莫伊卡没想到的是,他的工作早就引起了一家法国公司 Rhodia Food 的注意,这家公司主要生产一种法国地方特色食品——德国泡菜。而这家公司的技术人员早就发现,用来发酵的乳酸菌的体质似乎不能一概而论,明明是同一种乳酸菌,面对同一种病毒,有时候可以免疫有时候却不能,而这经常导致公司产品质量变得不太稳定。

而莫伊卡的工作一下子解开了他们多年的疑惑。他们立刻发现,对病毒的抗性与乳酸菌 DNA 中的 CRISPR 序列密切相关。于是以此为抓手改进工艺,果然大大缓解了困扰公司多年的品控问题。

让资本家赚到钱堪称是对科研成果的终极认可,毕竟市场才是检验一项技术是否有用的标准。一瞬之间,再也没有人怀疑莫伊卡理论的正确性了。在随后五六年里,CRISPR 犹如一个吸引无数玩家参与的拼图游戏,一块又一块的拼图碎片被世界各地的科学家拼接到位。

就这样,到 2011 年,德国马普感染生物学研究所的埃玛纽埃尔·卡彭蒂耶(Emmanulle Charpentier)终于在前人的基础上彻底研究透了 CRISPR 的运作原理。当时的她还不知道,她刚刚触及了生命代码中最大的漏洞。

寻找 DNA 程序的 bug

那年,在风景如画的波多黎各,一群科学家正聚集于此参加学术会议。其实很多时候,所谓的学术会议不过是科学家巧立名目公费旅游而已,他们吹着加勒比海舒爽的海风,纷纷卸下心防,把酒言欢,在一片声色犬马之中,卡彭蒂耶邂逅了来自加州大学伯克利分校的 RNA 学家詹妮弗·杜德娜(Jennifer Doudna),她向卡彭蒂耶提出了一个酝酿已久的想法——利用 CRISPR 技术进行基因编辑。

自从 DNA 双螺旋结构被发现以来,人类就一直试图掌控这编码了整个生物界的底层代码,然而即便是二十世纪九十年代,倾注了全世界科研资源的「人类基因组计划」,也仅仅只能让人粗略地「读」出这些代码,而编辑这些代码的技术却一直进展缓慢。

纵观整个二十世纪,人类对此最多也就是掌握了一些被称为「转基因」的技术,这有点儿类似于往生命系统里面安装个新程序,打打补丁啥的,对于系统原有的代码影响很有限也很难精确控制,实现「基因编辑」的梦想还遥遥无期。

原因无他,DNA 对于生物而言实在太重要了,所以我们的细胞会用尽一切手段去防止 DNA 被篡改。

我们知道 DNA 是一种细长的分子,细长就意味着容易断,所以细胞有很多方法把断掉的 DNA 给「焊」回去。

而在杜德娜与卡彭蒂耶的讨论中,却琢磨出了一个利用 CRISPR 卡 bug 来修改 DNA 序列的方法。上文提到,CRISPR 系统中最终发挥功能的是一个叫作 Cas 的蛋白质,由向导 RNA 帮助它找到目标 DNA 并切断之。我们可以根据需要篡改的 DNA 目标人工设计一段向导 RNA,再把编码这段向导 RNA 和 Cas 蛋白的 DNA 用「转基因」的方法导入到细胞内,就会制造出一大堆 Cas 蛋白,带着向导 RNA 去精确切割所要篡改的那段 DNA。

但是,再好的能工巧匠也不会绝对不犯错误,DNA 的修复也是一样,会有那么一丝丝修错的可能性。

那就好办了。

如果 DNA 序列修复如初,那么它就会继续被向导 RNA 锁定,Cas 蛋白就会再去切,一直切,切到 DNA 被不小心修错,序列发生变化,导致向导 RNA 无法再锁定它为止,而一旦 DNA 序列被修改就有一定概率导致这个 DNA 文件彻底变成乱码,从而让这个基因失去功能,从结果上看等同于删除了一个 DNA 文件。

当然,除了删除,我们也得会插入和修改,这里就会卡一个更加精妙的 bug。

如果一根棍子用断了,那么断面上就可能会有一些磨损,导致你把这根棍子直接合回去的时候断面不是那么严丝合缝。DNA 断裂时偶尔也有类似的情况,断的地方掉落几个碱基啥的,导致 DNA 没法儿直接拼回去,那么细胞应该怎样做才能把 DNA 修复如初呢?

其实细胞也不知道 DNA 本来「应该」是什么样子,但没事,像我们动物都是「二倍体」。简单来说,我们体内的每个基因都有两份,虽然这两份基因未必完全一样,但是在修复 DNA 时互相做个备份还是勉强凑合的。

但问题是细胞也不知道备份在哪里,长什么样,所以细胞的做法是拿着断 DNA 到处去比对,如果找到一段 DNA 序列和手里的断 DNA 断口前后的序列相似到一定程度,那系统就会判定这是修复的模板。

注:所以单倍体的生物 DNA 更容易突变,不过单倍体生物也有一些别的修复方式。

如果在转入 Cas 蛋白和向导 RNA 的同时,还转入一大堆与目标 DNA 相似的 DNA 片段,那么这些 DNA 片段就很有可能被细胞当作修复模板去修理断掉的 DNA。如果把这些 DNA 片段故意设计成自己所需要的样子,就可以根据自身需求来修改目标 DNA 片段了。

想明白了这一切,杜德娜与卡彭蒂耶再也坐不住了,她们迅速达成合作,只用了不到一年时间,就测试出了系统的最佳参数,并成功在试管里和细菌体内实现了 CRISPR 介导的基因编辑。

但随后,她们就很疑惑地发现自己的工作陷入了诡异的停滞,当她们试图在动物的细胞当中测试 CRISPR 时,曾经高效快捷的 CRISPR 却好像突然失效了,无论她们如何修改参数,动物细胞的 DNA 都岿然不动。

而这一点点小停滞,把她们的研究进度稍微拖慢了那么一点点,结果就让一个来自麻省理工学院的科学家半路杀出,后来者居上,那位科学家的名字叫作张锋。

科学天才

张锋生于中国河北省石家庄市,少年时随父母来到美国艾奥瓦州定居。在一堂课上,他看了一部电影叫《侏罗纪公园》,一般的少年看完以后是学里面的恐龙,但张锋学的是电影里的科学家,然后他真的去一家实验室学了一种转基因技术,叫作「慢病毒转染法」,还凭着这门手艺获得了英特尔少年科学天才奖(Intel Science Talent Search),随后他又去哈佛大学拿了个化学及物理双学士学位。

在此期间,张锋还到显微成像学领域前辈——庄小威教授的实验室里打杂,结果短短几个月时间,张锋那超越人类范畴的智力就让庄小威惊呼此人必将改变世界。

随后张锋又去斯坦福大学读研,刚一入学就帮助他的导师卡尔·迪赛罗斯完成了一项创造了神经科学新时代的重大科研突破,一举让迪赛罗斯成了诺贝尔奖的热门人选。

博士毕业,张锋就被哈佛大学特聘为「特殊研究员」。有了自由研究的权利后,张锋少年时的梦想又一次复苏,他开始对基因编辑这个课题产生了浓厚的兴趣。

专利的游戏

在 CRISPR 广为人知之前,世界上其实也有别的基因编辑技术的研发路线,在当时被寄予最大期望的一种基因编辑系统叫作 ZFN。我们无须对这个系统深入了解,只需知道它有一个小问题:其专利属于一家叫作圣加蒙的生物技术公司。

圣加蒙不但斥巨资垄断了一切与 ZFN 相关的技术专利,甚至还主张世界上所有科学家哪怕是为了改进 ZFN 系统都得向它付费。更丧心病狂的是,它还把 ZFN 最核心的部件列为商业机密,任何人想使用或研究 ZFN,都必须付高价向圣加蒙公司定制这些核心部件,而且公司还使用种种手段,宁可让 ZFN 性能下降也要修改工艺使之难以被外人破解。

经过这一通操作,原本前景广阔的 ZFN 研究几乎彻底停摆,到现在二十多年过去了,愣是没有开发出哪怕是一种基于 ZFN 的实用技术。而全世界的基因编辑专家也不得不放弃自己原有的研究,转而想办法寻找新的技术路线来绕开圣加蒙公司的专利垄断。

张锋自然也加入到了

相关Tags:生命

猜你喜欢

精选微小说