CRISPR-Cas系统及相关技术
CRISPR Cas in 细菌
CRISPR(Clustered Regularly Interspaced Short Palindromic Repeats,成簇规律间隔短回文重复序列)系统是一种来源于细菌和古菌的获得性免疫机制,能够识别并切割外来的遗传物质,如噬菌体DNA。该系统由两部分主要组成:CRISPR序列和与之相关联的Cas(CRISPR-associated)蛋白。
CRISPR序列
CRISPR序列是一段DNA序列,包含短的直接重复序列和其间隔插入的间隔序列。重复序列通常是回文序列,能够形成发夹结构,有助于转录后crRNA的稳定性。间隔序列则源自曾感染该细菌的外源DNA(如病毒DNA),充当免疫记忆的信息库,用于后续识别同一类入侵者。
Cas蛋白
Cas蛋白通常位于CRISPR序列上游,种类繁多,具有多种功能,包括核酸的识别、剪切和解链等。核心Cas蛋白包括:
- Cas1 与 Cas2:具有内切酶活性,Cas1还具核酸结合功能,在新间隔序列的整合中发挥关键作用。
- Cas3:具有DNA解链酶与核酸酶双重功能,是I类系统中的降解主力。
- Cas4 与 Cas6:也表现出内切酶活性,参与pre-crRNA的加工过程。
- Cas9:II类系统中的多功能蛋白,兼具DNA识别与切割功能,是目前基因编辑领域的核心工具。
CRISPR免疫过程
CRISPR-Cas系统的免疫反应通常可分为三个阶段:获取(adaptation)、表达与加工(expression & processing)、干扰(interference)。
(1)间隔序列的获取
- 外源DNA中含有特定的PAM序列(Protospacer Adjacent Motif)作为识别标志。Cas1和Cas2蛋白被招募,剪切目标DNA,并识别CRISPR阵列前导序列(leader sequence),将新间隔序列插入第一个重复序列与原首个间隔之间。
- 缺口由DNA聚合酶催化合成短重复序列,完成修复和整合。
(2)CRISPR RNA (crRNA) 的表达与加工
- 整个CRISPR阵列被转录为一条长的pre-crRNA(前体CRISPR RNA)。
- 加工方式因系统类型不同而异:
- I类与III类系统:Cas6或其他内切酶(如Cas3)识别重复序列并剪切,生成多个成熟的crRNA,每条含一个间隔序列及部分重复序列。
- II类系统:缺乏Cas6,依赖tracrRNA(转录激活的crRNA)与重复序列互补配对。形成双链结构后由RNA酶III加工成成熟的crRNA,通常丢失约10个核苷酸。
(3)外源核酸的识别与降解
- 成熟的crRNA与Cas蛋白结合,形成crRNP复合物,能够识别并结合与其间隔序列互补的外源DNA。
- I类与III类系统:需要多个Cas蛋白组成复合体,由Cas3完成切割和降解。
- II类系统:仅需Cas9蛋白与crRNA、tracrRNA共同作用,即可识别PAM旁的靶DNA并进行双链断裂。
CRISPR-Cas9技术:Type II系统
CRISPR-Cas9是一种源于细菌的Type II类CRISPR系统,具有可编程的DNA编辑能力。其核心机制依赖于Cas9蛋白与sgRNA形成的复合体识别靶DNA,并进行双链断裂。该技术因其简洁、高效、特异性强,被广泛应用于基因编辑、功能基因筛选和治疗研究中。
(1)Cas9蛋白结构与功能
Cas9蛋白是一种多结构域的RNA引导核酸酶,具备识别、结合和剪切DNA的多重能力。主要结构包括:
- REC lobe(RNA识别域):识别并稳定sgRNA的空间构象,确保其功能性结构完整。
- HNH结构域:负责切割与crRNA序列互补的DNA链(靶链)。
- RuvC结构域:切割非互补链,与HNH协同完成DNA双链的断裂。
- PAM识别结构域:专门识别目标DNA邻近的PAM序列(如5'-NGG-3'),是Cas9结合靶DNA的前提。
(2)sgRNA的结构与功能
sgRNA(single-guide RNA)是crRNA与tracrRNA人工融合形成的单链引导RNA,简化了天然系统的双RNA结构。其功能包括:
- crRNA部分含有约20个碱基的引导序列,与靶DNA序列互补配对,决定编辑的靶点。
- tracrRNA部分与Cas9结合,保持sgRNA的稳定性和功能活性。
(3)机制:从识别到切割
1)PAM识别:Cas9首先识别目标DNA上5'-NGG-3'的PAM序列。缺乏PAM的DNA不会被Cas9识别,防止系统自我切割。 2)DNA靶向配对:识别PAM后,Cas9解旋靶DNA,使sgRNA的引导序列与其互补配对。 3)DNA双链断裂:Cas9在识别完成后激活两种内切酶活性。RuvC结构域切割非互补链,HNH结构域切割互补链,最终在目标位点形成钝端双链断裂(DSB)。
(4)DNA断裂后的修复机制
靶DNA被Cas9剪切后,细胞通过自身的DNA修复机制处理断裂,常见方式包括:
- 非同源末端连接(NHEJ):
- 是一种快速但低保真的修复机制,常引入碱基缺失或插入(indels),可导致移码突变或基因功能丧失。适用于基因敲除或非精确修复。
- 同源重组修复(HDR):
- 需提供一段外源同源模板(donor DNA),可用于高精度地插入、替换或修复基因。效率相对较低,但精确性更高,常用于治疗性基因编辑和疾病模型构建。
Cas9 酶的变体
dCas9(dead Cas9,失活型Cas9)
dCas9 是一种经突变获得的 Cas9 蛋白变体,通过同时失活其两个核酸内切酶活性位点(HNH 和 RuvC)而获得“失活”特性,无法切割DNA,但仍能高效结合目标DNA序列。
常见突变:
- D10A(RuvC结构域失活)
- H840A(HNH结构域失活)
dCas9 可用于以下几种功能:
- CRISPRi(基因表达抑制):dCas9 静态结合于启动子区域或转录起始点,阻断RNA聚合酶结合,从而抑制目标基因转录。
- CRISPRa(基因激活):将 dCas9 融合转录激活因子(如VP64、p65)引导至启动子上游,激活转录表达。
- 染色体定位与成像:dCas9 可融合荧光蛋白(如GFP)实现对特定染色位点的可视化追踪。
- 表观遗传修饰:可融合组蛋白乙酰转移酶、DNA甲基化酶等,实现DNA修饰或染色质状态调控。
由于不引发DNA断裂,dCas9 被认为具有高度安全性,适合在活细胞或复杂组织中进行非破坏性调控。
Cas9n(Cas9 nickase,单链切口酶)
Cas9n 是指通过突变使 Cas9 仅保留一个内切酶活性的变体,只能在 DNA 的一条链上造成单链切口(nick),而非双链断裂。根据保留的结构域不同,可分为:
- D10A 突变:RuvC结构域失活,HNH结构域保留,切割互补链(target strand)
- H840A 突变:HNH结构域失活,RuvC结构域保留,切割非互补链(non-target strand)
Cas9n 的应用包括:
- 碱基编辑(Base Editing):Cas9n 融合脱氨酶(如APOBEC、TadA),在不造成DSB的前提下,实现碱基间的C→T或A→G转换。
- 先导编辑(Prime Editing):Cas9n 融合逆转录酶(RT),与pegRNA配合,实现在基因组中特定位点的插入、缺失或精确突变。
- 降低脱靶效应:相较于野生型Cas9的双链断裂,Cas9n引发的单链切口对基因组稳定性影响更小,更安全。
Cas9n 保留一定的编辑活性,同时具备更高的编辑精度和较低的毒性,是精准基因治疗的重要工具。
CRISPR Cas9 及其变体可以完成的技术
技术 | 名称 | 机制 |
---|---|---|
基因敲除 | Gene Knockout | 引发双链断裂(DSB),通过非同源末端连接(NHEJ)修复,常导致基因功能丧失。 |
基因敲入 | Gene Knock-in | 引发DSB,并提供含有同源臂的供体模板,依赖同源重组修复(HDR)实现特定序列的插入或替换。 |
表观调控 | CRISPRi / CRISPRa via dCas9 | 使用失活的Cas9(dCas9),无核酸酶活性,仅结合靶DNA,通过阻断转录或招募转录激活因子实现基因表达调控。 |
碱基编辑 | Base Editing, BE | dCas9或Cas9n与脱氨酶融合,无需造成双链断裂,可实现单个碱基的精准转换(如C→T或A→G)。 |
先导编辑 | Prime Editing, PE | 基于Cas9n、逆转录酶(RT)和pegRNA三元系统,可实现插入、删除和多种碱基替换,无需双链断裂或供体模板。 |
[1]先导编辑 Prime Editing
先导编辑(Prime Editing)是一种无需产生DNA双链断裂(DSB)的高级定点基因编辑技术。其核心组件包括:
- Cas9 nickase(Cas9n):只能对DNA的一条链产生单链切口(nick)
- 逆转录酶(RT):与Cas9n融合,用于将RNA模板的信息转录进DNA
- pegRNA(prime editing guide RNA)
pegRNA 具备双重功能,其结构包括:
1. 一段与目标DNA序列互补的“引导序列”,用于将编辑系统准确定位;
2. 一段携带预期突变的“模板序列”,与目标DNA序列高度相似,但包含特定碱基替换、插入或缺失。
当编辑系统定位到目标DNA序列后,Cas9n在目标位点产生一个单链断裂。此切口处的DNA末端可被融合的逆转录酶识别,并作为引物启动逆转录,以pegRNA中的“模板序列”作为模板,合成一段含有突变的新DNA链。
此过程并非绝对发生:在某些情形中,RT可能在未完成合成前即从DNA解离,导致编辑失败。
形成的新DNA链与原有的DNA互补链存在差异,二者会以一种被称为翼式结构(flap structure)的方式共存。细胞的DNA修复机制随后处理这一翼式结构:
- 如果原有互补链被移除,则突变链被保留,目标位点成功被编辑为pegRNA上设计的序列;
- 如果突变链被移除,则目标位点保持原样(即野生型);
- 有时会形成碱基错配,在随后的修复过程中可能偏向保留突变型,也可能回归野生型。
这一过程表现出高度的可编程性,但也带来了不确定性。
优点:
- 不依赖双链断裂,减少脱靶效应及大范围结构性突变风险;
- 可实现多种类型的碱基替换、插入与缺失,编辑形式灵活。
缺点:
- 编辑效率受限,成功率受多因素影响,存在大量“可能失败”的步骤;
- 翼式结构及错配修复路径的不确定性使得结果较难预测。
CRISPR Cas13 技术——靶向RNA的CRISPR Cas
CRISPR-Cas13 是一种以 RNA 为靶标的 CRISPR 系统,属于 CRISPR Class 2 Type VI 类别。该系统不同于 Cas9 等针对 DNA 的编辑工具,其功能在于特异性识别并切割单链 RNA,具有 RNA 靶向干扰、RNA 可视化、分子诊断和 RNA 编辑等多种生物技术应用前景。
基本原理
Cas13 系统的核心为 Cas13 蛋白和引导 RNA(crRNA)。Cas13 可与 crRNA 形成复合物,识别具有互补序列的目标 RNA。在结合目标 RNA 后,Cas13 被激活,展现出两种活性:
- 特异性切割:精准切割目标 RNA 分子
- 非特异性胶合切割(collateral cleavage):激活状态下,Cas13 还会切割周围无关 RNA,形成“胶合剪切”效应,可用于信号放大等用途
与 DNA 靶向系统如 Cas9 不同,Cas13 不依赖 PAM序列,使其靶标选择更灵活。
Cas13 亚型
Cas13 蛋白家族包括多个亚型,各自具有不同来源和特性:
- Cas13a(原名 C2c2):最早发现,具有典型的胶合切割特性
- Cas13b:靶向准确性更高,活性较强
- Cas13c:研究较少,靶向宽容度较大
- Cas13d:分子量较小,适合病毒载体包装,常用于体内应用
- Cas13X/Y:新近发现,体积更小,适用于合成生物系统
工作机制
- crRNA 被设计为包含目标 RNA 的互补序列
- crRNA 与 Cas13 蛋白结合,形成识别复合物
- 复合物与目标 RNA 配对后,Cas13 被激活
- 激活的 Cas13 对目标 RNA 进行精确切割,并同时触发胶合切割,对周围 RNA 造成降解
应用场景
RNA 靶向干扰
Cas13 可被用作精准 RNA 降解工具,用于研究基因功能或抑制特定 mRNA、lncRNA 等。相比传统 RNAi 技术,Cas13 更具特异性,且不依赖宿主细胞的 RNA 干扰通路。
RNA 可视化
通过与荧光标签蛋白(如 GFP)融合,可实现对特定 RNA 分子的活细胞成像,用于观察 RNA 定位和时空表达。
分子诊断(SHERLOCK)
Cas13 的胶合切割特性被应用于 SHERLOCK(Specific High Sensitivity Enzymatic Reporter UnLOCKing)系统。在靶标 RNA 存在时,Cas13 被激活,切割人工设计的荧光探针,从而实现疾病 RNA 检测,如 SARS-CoV-2、寨卡病毒等。该系统灵敏度高、速度快、可用于便携诊断。
RNA 编辑(REPAIR 系统)
通过去活化 Cas13 切割能力并与腺苷脱氨酶(ADAR)融合,可实现 A→I 的可逆 RNA 编辑。该方法不涉及基因组永久变更,适用于需要暂时性基因调控的治疗策略。
- ↑ 除PE部分外,其余部分由Kotodama编辑