基因组编辑技术是一种通过同源重组手段定向改造基因组的技术,是进行基因组改造和探索基因功能的关键手段,包括基因敲除、外源基因定点插入、基因定点突变,以及染色体大片段的重排和删除等。传统的靶向基因组编辑技术主要依赖于基因同源重组,利用设计的同源臂替代靶基因片段,从而达到基因敲除的目的,但是同源重组在细胞中的发生概率极低,而且步骤比较复杂、耗时间、费用也比较高。
近几年出现了很多新型基因组编辑工具,如锌指核酸酶(zinc finger nucleases,ZFN)、类转录激活因子效应物核酸酶(Transcription activator-like effector nuclease,TALEN)以及CRISPR-Cas9技术。利用ZFN、TALEN以及CRISPR-Cas9技术可以在特定位点产生基因组双链DNA断裂(double-strand breaks,DSB),通过非同源末端连接(non homologous end joining, NHEJ)诱发DNA的错误修复,进而形成各种基因大段删除或重排。其中,CRISPR-Cas9技术由于构建简单、成本低、效率高等特点,自发明以来,迅速被研究人员广泛应用于各类科学研究中,成为了当今生命科学研究的热门技术。
作为最新最“火”的基因组编辑技术,CRISPR-Cas9技术被评为2013年生物学十大突破,2014年值得关注的技术。该技术的发明者之一,麻省理工大学的张锋教授2013年被Nature杂志评为十大人物。
图1. CRISPR-Cas9技术示意图
CRISPR-Cas9技术简介
不论是ZFN技术还是TALEN技术,其介导的基因定向打靶都依赖于DNA特异性结合蛋白的合成,由于这一步骤繁琐、耗时、花费高,因此限制了ZFN和TALEN的应用。而CRISPR-Cas9技术能够介导由RNA导向的DNA识别及编辑,使用一段序列特异性向导RNA分子(sequence-specific guide RNA,gRNA)引导核酸内切酶到靶点处,从而完成基因组的编辑,该系统制作简单、成本低、作用高效,为构建更高效简便的基因组编辑技术提供了全新的平台。
图2. CRISPR-Cas9适应性免疫系统的特性
CRISPR/Cas系统最早是在细菌的获得性免疫系统中发现的。规律性重复短回文序列簇 (clustered regularly interspaced short palindromic repeats, CRISPRs) 是一类独特的DNA规律性重复序列,存在于大多数的细菌和古细菌中。通常在临近CRISPR的区域还包含一组保守的蛋白质编码基因,被称为Cas(CRISPR-associated)基因,其编码的蛋白质包括核酸酶、聚合酶、解旋酶,具有与核糖核酸结合的功能。这些Cas蛋白与CRISPR转录出的RNA结合形成核糖核蛋白复合物,在原核生物中发挥着获得性免疫功能,使宿主获得抵抗噬菌体、质粒等外来DNA入侵的免疫能力。一般来说,当外源DNA片段入侵后,宿主会捕获一段20bp左右的DNA片段(被称为protospacer),将其插入到自身的基因组中,形成CRISPR区域,在Type II CRISPR-Cas系统中,主要由Cas9蛋白、反式激活 crRNA(trans-activating crRNA, tracrRNA)和 CRISPR-derived RNA(crRNA)组成。CRISPR区域首先转录成前体RNA(pre-crRNA),在Cas9蛋白的参与下加工成一段含保守重复序列和间隔区的成熟crRNA,同时,tracrRNA也会被转录并和crRNA形成一种双链的RNA结构,然后与Cas9蛋白组成具有DNA内切酶活性的复合物。该复合物在crRNA的引导下,由Cas9蛋白的核酸结构域对外源DNA进行切割(如图2)。其中,tracrRNA结合DNA序列的位置是protospacer和PAM(protospacer-adjacent motif)序列,CRISPR-Cas9系统的切割位点依赖于crRNA互补序列下游的PAM序列,该序列对于靶位点的识别和切割是必需的,在每4~8 bp的随机DNA序列中就重复出现一次,因此对于靶位点的设计还是相对容易的。
研究发现,将pre-crRNA和tracrRNA构建成一个融合RNA(single-guide RNA, sgRNA)来模拟成熟的crRNA和tracrRNA,导入细胞后同样可以与Cas9蛋白共同作用特异地切割目的DNA,从而将CRISPR-Cas9系统简化成Cas9蛋白和sgRNA两个组分,来实现对特定靶向位点的切割。
CRISPR-Cas9技术的操作步骤
通过人工设计tracrRNA/crRNA,可以改造成具有引导作用的sgRNA,以引导cas9对DNA的定点切割,造成DNA双链的断裂,然后细胞可以利用NHEJ或者同源重组的方式实现基因敲除或对基因精确编辑的目的,CRISPR-Cas9技术的应用主要包括以下几个关键步骤(如图3):
图3. CRISPR-Cas9技术的应用流程
1. 靶基因分析:根据靶基因的名称和种属信息,在NCBI、Ensembl Genomes或其他分子生物学网站上进行查找,搜索到该基因的信息,并明确CDS外显子部分;
2. sgRNA位点设计:确定待敲除位点,对于蛋白编码基因,如果该蛋白具有重要结构功能域,可考虑将基因敲除位点设计在编码该结构域的外显子;如果不能确定基因产物性质,可选择将待敲除位点放在起始密码子ATG后的外显子上。如果是microRNA,可以将待敲除位点设计在编码成熟microRNA的外显子或在编码成熟microRNA的外显子的5’和3’侧翼序列。选择好要设计的区域后,再通过预测网站进行序列预测。序列预测的目的主要是避免Cas9脱靶效应,以确保设计的sgRNA尽可能的减少脱靶效应;
3. Cas9载体构建:根据sgRNA序列,安排引物合成。引物合成时,需要在引物的5’端引入粘性末端。将引物退火形成带粘性末端的双链片段,取1ul用于后续的连接反应,其余在-20℃下保存。对表达载体先进行限制性内切酶酶切,得到线性化载体,再把前面得到的双链片段连接入表达载体。再进行感受态细胞的转化和阳性转化子的鉴定;
4. Cas9载体活性检测:对于构建的Cas9载体,转染细胞进行重组效率的检测,检测的方法主要是采用特异性片段扩增后进行的T7E1酶切处理,这一方法可以特异、定量的检测基因组重组效率。
CRISPR-Cas9技术优点
作为被称为第三代基因编辑技术的CRISPR-Cas9系统,相比于ZFN系统和TALEN系统,它有着如下优点:
1. CRISPR-Cas9系统的可用位点更多:理论上基因组中每8个碱基就能找到一个可以用CRISPR-Cas9进行编辑的位点,可以说这一技术能对任意基因进行操作,而TALEN和ZFN系统则在数百甚至上千个碱基中才能找到一个可用位点,大大限制了使用范围;
2. CRISPR-Cas9系统更具有可拓展性:例如可以通过对Cas9蛋白的修饰,让它不切断DNA双链,而只是切开单链,这样可以大大降低切开双链后带来的非同源末端连接造成的染色体变异风险。此外还可以将Cas9蛋白连接其他功能蛋白,从而在特定DNA序列上研究这些蛋白对细胞的影响;
3. CRISPR-Cas9系统的使用极为方便,只需要简单的几步就能完成,几乎任何实验室都可以开展工作,因此省时省力;
4. 可同时对几个基因进行操作:利用CRISPR-Cas9技术可以非常高效地对多个基因进行敲除,这一特点在针对多基因突变而引起的疾病研究中将发挥重要作用,而ZFNs和TALEN两项技术则难以实现这种效果。