经常会有小伙伴问用CRISPR/Cas9系统敲除整个外显子或者lncRNA的效率是多少,和敲除片段的大小有关系吗?为了回答这个问题,在此和大家分享一篇验证这类敲除效率的文章。
文章题为“Characterization of Genomic Deletion Efficiency Mediated by Clustered Regularly Interspaced Palindromic Repeats (CRISPR)/Cas9 Nuclease System in Mammalian Cells”,2014年发表在JBC上,NCBI显示目前已经累计被引用154次。
为了研究CRISPR/Cas9介导的基因组片段敲除的效率,该文章设计了一系列的成对sgRNA用于敲除长度在1.3kb到1MB的基因组上的片段(图1)。这些片段有些位于外显子区,有些位于内含子区,也有部分位于基因间区。且涉及被编辑的基因都与细胞增殖无关。
图1. 成对sgRNA靶点设计
成对sgRNA设计,虽然有可能会将两个sgRNA中间片段敲除,但也可能在原位修复,不发*删除。为了检测出现的具体结果,在不同的靶点附近,作者设计了多对引物。
图2. 修复结果分析的引物设计
在开始检测该细胞是否有等位基因发*敲除时,利用了图2中上面的蓝色及红色两对引物,红色引物位于两个sgRNA之间,蓝色引物位于两个sgRNA之外。此时有三种情况,第一,如果红色引物PCR后跑DNA胶无条带,蓝色引物PCR有条带(如果中间片段没有被敲除,蓝色引物中间片段过长,PCR无法扩增出该产物),则说明是纯合子敲除。第二,如果红色引物PCR有条带,而蓝色引物PCR也有条带,则说明杂合子敲除。第三,如果红色引物PCR有条带,而蓝色引物PCR无条带,则说明没有发*敲除。
但是,对于红色引物PCR产物有条带,还有一种情况需要分析,即两个sgRNA中间片段是否发*了颠倒。于是作者又设计了图2中下面的绿色及紫色两对引物用于扩增sgRNA靶点及其附近序列,如果引物1,2和引物3,4分别PCR有条带则说明没有发*颠倒,如果引物1,3和引物2,4有条带则说明中间片段发*了颠倒。
图3. 成对sgRNA切除基因片段效率
17对sgRNA挑选出了1974个克隆,最终共检测了278个单克隆细胞株。按照等位基因进行分析,278株细胞有556个等位基因。149/556(26.8%)个等位基因中间片段被删除,72/556(12.9%)个等位基因中间片段发*了颠倒,剩余约60%在Cas9切割的位置原位修复,未导致删除。在做外显子敲除时,等位基因颠倒的情况也是可以考虑的一种基因编辑方式。从整体看,等位基因颠倒加上删除的比例接近40%。但是,对于lncRNA的敲除,由于不确定颠倒是否会失活其功能,因此lncRNA不建议使用颠倒的克隆用于后续实验。
按照细胞株进行分析,31/278(11.2%)的细胞为双等位基因删除细胞,2/278(0.7%)的细胞为双等位基因颠倒细胞。26/278(9.4%)的细胞其中一个等位基因删除,一个等位基因颠倒。61/278(21.9%)的细胞其中一个等位基因敲除,另外一个等位基因在Cas9切割的位置原位修复。39/278(14.1%)的细胞其中一个等位基因颠倒,另外一个等位基因在Cas9切割的位置原位修复,而两个等位基因既没有删除又没有颠倒的细胞比例为119/278(42.8%)(图3)。
在将所有数据统合后,文章进一步分析了敲除片段长度与敲除效率的关系(按照等位基因进行分析),得出结论,敲除效率与敲除长度呈负相关性(图4)。可以看到,当敲除片段在23kb以内时,敲除效率基本都在10%以上,甚至还有许多片段的敲除效率在20%乃至30%以上。
除去这些敲除效率的信息外,文章中还有一些值得留意的细节。第一,6/40(15%)双等位基因敲除细胞是精确删除的;27/87(31%)的单等位基因敲除细胞是精确敲除的。补充一下,目前认为野*spCas9的切割位点位于靶点的第17和18位中间,切割产*平末端,所谓精确敲除即两个cas9切割后的序列直接相连,中间没有缺失或者插入其他序列。第二,对于不是精确删除的细胞,由于两个平末端是被NHEJ修复方式修复的,往往会引入一些indel,这些indel的长度绝大部分集中在-10bp-0bp(负号代表删除,正号代表插入)。第三,对于双等位基因敲除细胞,其中部分进行一代测序发现,22/31(71%)的细胞两个等位基因中间的indel序列是完全相同的,9/31(29%)的细胞两个等位基因的indel片段不同。
如果将这里的第一点和第三点结合起来看,会发现NHEJ比较有趣的一些内容。比如,如此高的精确修复比例,说明NHEJ修复过程中有很大可能是不引入indel的。再比如,高比例的纯合子删除(indel相同)暗示NHEJ可能存在按照模板修复的可能性。