讨论:核酸的结构

来自osm&bio
跳到导航 跳到搜索

总论

文件:511.png
图1:核酸的双螺旋结构
  • 核酸(Nucleic Acid)的化学本质是核苷酸(Nucleotide)通过5‘-3’磷酸二酯键相连形成的多聚物,有时多聚物再通过氢键结合成更大的分子。
  • 最常见的氢键结合方式是双螺旋结构,但还有很多其它结合方式。

核苷酸

文件:512.png
图2:常见含氮碱基
文件:513.png
图3:核苷酸
文件:515.png
图4:核苷酸中糖基的常见构象
文件:516.png
图5:含氮碱基的两种构象
文件:517.png
图6:含氮碱基的电离
文件:518.png
图7:含氮碱基烯醇异构举例
文件:519.png
图8:各含氮碱基的光谱性质
文件:520.png
图9:各含氮碱基的疏水性比较
文件:521.png
图10:亚硝酸、亚硫酸、羟胺、硫酸二甲酯能修饰碱基
文件:522.png
图11:亚硝酸、甲醛等物质能造成不同碱基间的交联
文件:523.png
图12:紫外线造成嘧啶环交联
文件:524.png
图13:碱基的天然修饰
文件:525.png
图14:人工合成的含氮碱基类似物
  • 核苷酸由三部分组成:糖基、含氮碱基(Nucleobase)、磷酸基团。(按照传统,糖基的C原子编号为单糖的C原子编号加上撇号。)
  • 糖基可以是核糖或2‘-脱氧核糖,对应的核苷酸分别为核糖核苷酸(Ribonucleotide)和脱氧核糖核苷酸(Deoxyribonucleotide)。
  • 含氮碱基分为两类:嘌呤(Purine)的衍生物、嘧啶(Pyrimidine)的衍生物。
  • 常见嘌呤的衍生物有:腺嘌呤(Adenine)、鸟嘌呤(Guanine)。
  • 常见嘧啶的衍生物有:胞嘧啶(Cytosine)、尿嘧啶(Uracil)、胸腺嘧啶(Thymine)。
  • 糖基通过糖苷键和含氮碱基的一个N原子相连,即嘌呤的9号N原子,或嘧啶的1号N原子。
  • 磷酸基团(-OPO32-)与糖基的5’碳原子相连。
  • 各含氮碱基用英语的首字母表示(A,G,C,U,T),对应的核糖核苷酸用首字母加MP(表示Monophosphate)表示(AMP,GMP,CMP,UMP,TMP),对应的脱氧核糖核苷酸用核糖核苷酸加d(表示Deoxy)表示(dAMP,dGMP,dCMP,dUMP,dTMP)。(可用N表示任意核苷酸,如dNTP表示任意脱氧核糖核苷酸)
  • 常见的核苷酸中,核糖核苷酸不带胸腺嘧啶,脱氧核糖核苷酸不带尿嘧啶。(有例外,见下文)

不参与形成核酸的核苷酸

  • 核苷酸可以带有多个磷酸基团,彼此通过磷酸酯键相连成链,一般数量为2-3个,分别用(d)NDP(Diphosphate)和(d)NTP(Triphosphate)表示,它们在代谢中有重要功能,特别是ATP,它是所谓的“能量通货”。
  • 也发现过带4个和5个磷酸基团的核苷酸。
  • 核苷酸的磷酸基团可以和3'的羟基成酯,称为环核苷酸,用cNMP表示,其中cAMP和cGMP在细胞通讯中是重要的第二信使。

核苷酸的性质

  • 核苷酸的含氮碱基和5‘碳原子都在糖基环的同一面上,即糖苷键是β型的。
  • 核苷酸的糖基环上的5个原子不在一个平面上,因为那样张力太大。
  • 因此至少有一个C原子在糖基环平面之外,最可能的是2'和3’碳原子。
  • 如果突出的C原子与含氮碱基在同一侧,称为endo型,反之称为exo型,两者快速相互转化,核苷酸中没有倾向。
  • 含氮碱基有两种构象,记作syn型和anti型,两者不会快速转化,anti型更常见。(嘧啶不会出现syn型,嘌呤在特殊情况下会出现syn型)

含氮碱基的性质

  • 含氮碱基的各环都在一个平面上。
  • 环边上的附属基团可以旋转,甲基旋转较快,氨基旋转较慢。
  • 环上的N原子可以发生极弱的电离。(图6)
  • 磷酸基团会提高电离的pKa值,脱氧核糖核苷酸中对应的pKa略高。
  • 可以根据含氮碱基的这一性质,用离子交换色谱法或电泳法分离核苷酸。
  • 每种含氮碱基都能发生多种异构反应。(常见举例见图7)
  • 含氮碱基的环可以吸收紫外线,有些环的吸收值和电离情况有关,但都在260 nm附近。
  • 水溶液中含氮碱基有非常微弱的荧光。
  • 含氮碱基容易受到很多种化学修改,一个人的细胞所含的30亿个碱基对中,每天都会遭受100-5000次修改,但细胞有各种酶修复这些修改。
  • 亚硝酸、亚硫酸、羟胺、硫酸二甲酯能化学修饰甲基,其作用方式见图10。
  • 亚硝酸、甲醛等物质能造成不同含氮碱基间的交联,其作用方式见图11。
  • 烷化剂(Alkylating Reagent)是很强的亲电子基团,被它们攻击的含氮碱基会带有正电荷。
  • 紫外线能以多种方式损伤核苷酸,包括形成氧自由基产生氧化损伤,和将嘧啶环交联。(图12)
  • 嘧啶环交联最主要发生在胸腺嘧啶之间,也会发生在胞嘧啶之间,和胸腺嘧啶-胞嘧啶之间。
  • 细胞自身会将正常核酸中的部分含氮碱基修饰,其功能有保护、调控转录、参与复制。
  • 最常见的天然修饰是胞嘧啶的C5甲基化、N4甲基化,和腺嘌呤的N6甲基化,它们在DNA复制中也会随之复制,是表观遗传的一部分。
  • 很多人工合成的核苷酸类似物进入细胞后会抑制DNA复制,被用作药物。(举例见图14)

多聚核苷酸和DNA

文件:514.png
图15:多聚核苷酸
文件:526.png
图16:多聚核苷酸的可自由旋转部位
文件:527.png
图17:Watson-Crick配对
文件:528.png
图18:常用描述双螺旋结构的参数
文件:529.png
图19:三种常见DNA双螺旋结构
文件:530.png
图20:Hoogsteen配对
文件:531.png
图21:三螺旋结构
文件:532.png
图22:H-DNA
文件:533.png
图23:G四联体
文件:534.png
图24:G四联体的产生方式
文件:535.png
图25:i模体
文件:536.png
图26:十字形DNA
  • 核苷酸的3'碳原子上的羟基与另一个核苷酸的磷酸基团成酯,这种连接方式称为5'-3'磷酸二酯键。
  • 多聚核苷酸就是许多个(可达几亿个)核苷酸按一定顺序通过5'-3'磷酸二酯键相连形成的大分子。
  • 多聚核苷酸的构象很自由,因为每两个碱基之间的碳骨架有6个可自由旋转的角度。(图16)
  • 由核糖核苷酸组成的多聚核苷酸称为核糖核酸(Ribonucleic Acid,RNA);由脱氧核糖核苷酸组成的多聚核苷酸称为脱氧核糖核酸(Deoxyribonucleic Acid,DNA)。
  • 多聚核苷酸有5'端和3‘端,即5’或3‘碳原子不与其它核苷酸相连的一端,每一端都可与一个或多个磷酸基团相连,或没有。
  • 细胞中合成多聚核苷酸的方式总是从5’端向3‘端合成,因此书写多聚核苷酸的结构的默认格式是依次写出从5’端到3‘端的核苷酸。(若要反过来写,则两端注明3'和5')
  • 遇到结构特殊的多聚核苷酸,在核苷酸之间或多聚核苷酸两端加上若干个p表示此处的磷酸基团数量,用约定俗成的记号表示罕见核苷酸。

DNA的双螺旋结构

  • 细胞中的DNA一般以两条多聚核苷酸(“链”)通过氢键相连成双螺旋结构(图1)的形式存在,虽然严格地说是两个分子,但一般把此结构视作一个分子。
  • 核苷酸的磷酸基团和糖基组成螺旋边缘的骨架(Backbone),而碱基像梯子一样横在中间,两两通过氢键相连配对,形成碱基对(Base Pair)。
  • 两条链是反平行排列的;两条链可以分别首尾相连,形成环状DNA。
  • 组成双螺旋结构的两条链不一定完全一样,两端各可多出若干个核苷酸。
  • 并非任意两个核苷酸能相互配对,允许的配对称为Watson-Crick配对,只有两对:A↔T和C↔G。
  • A↔T有两个氢键,C↔G有三个氢键,C↔G较为稳定。
  • 一对碱基对,其糖苷键不是平行的,而是成一定角度,由此将碱基对所在平面分为两部分,含钝角的部分称为小沟(Minor Groove),含优角的部分称为大沟(Major Groove)。
  • 相邻的碱基对不是完全重叠的,而是沿中轴旋转一定角度,此现象源于堆积作用(Stacking Interaction),它是由碱基的环中的π电子引起的,会使碱基与水的接触面积最小。(此现象造就了“双螺旋”结构,碱基堆积作用是稳定DNA结构的主要作用)
  • DNA晶体中,常见的双螺旋构象有三种,分别称为A-DNA、B-DNA、Z-DNA,细胞中几乎只出现B-DNA的形式。
  • A-DNA和B-DNA都是右手螺旋,前者出现在较干燥环境,后者出现在较湿润环境,以湿度85%为界,加乙醇可使B-DNA变为A-DNA。
  • 含鸟嘌呤较多的区域易于形成A-DNA,而含腺嘌呤较多的区域不易;较短的DNA更易形成A-DNA。
  • 腐胺(Putrescine)、亚精胺(Spermidine)、精胺(Spermine)、六氨合钴(Hexamminecobalt(III))、新霉素(Neomycin)可稳定A-DNA。
  • 嘧啶和嘌呤交替出现的区域容易出现Z-DNA。

DNA的罕见结构

  • DNA的双螺旋结构中,所有的含氮碱基的构象都是anti型。
  • 一定情况下,嘌呤可以变为syn型,再与anti型的嘧啶配对,此时氢键连接方式发生变化,不再称作Watson-Crick配对,而称为Hoogsteen配对。
  • Hoogsteen配对中,两个糖基的1'碳原子的距离比B-DNA短很多,因此它一般出现在B-DNA被染色剂或药物插入扭曲的部位。
  • 特定情况下,DNA会形成三螺旋结构(Triple Helix),第三条链即通过Hoogsteen配对与另一条链结合。
  • 第三条链既可平行配对也可反平行配对,前者适合富含嘧啶的链,后者适合富含嘌呤的链。
  • 第三条链从另一条链的大沟一侧与之结合。
  • 较低pH能稳定平行配对的三螺旋,而反平行配对的三螺旋对pH不敏感。
  • 鸟嘌呤和腺嘌呤交替出现的链,在负超螺旋或低pH环境中会出现H-DNA结构,其中包含三螺旋结构。(图22)
  • 富含鸟嘌呤的链会形成G四联体结构(Guanine Quartet),此现象常见于真核生物的染色体的末端的端粒中。(图23,24,其中金属离子可为K+,Na+,Cs+,Li+
  • 富含胞嘧啶的链在强酸性环境中也会形成一种四联体结构,称为i模体(i-Motif)。(图25)
  • 回文序列(Inverted Sequence)会形成十字形结构,见图26。

DNA和小分子结合

  • 大多数和DNA结合的药物是在小沟一侧与之结合的,特别是富含A-T的区域。
  • 几乎所有含较大的芳香族发色团的分子都能将发色团插入碱基对之间,最常见的是溴化乙锭(Ethidium Bromide,EB)和补骨脂素(Psoralen)。
  • 芳香族分子结合时,主要的稳定作用仍是碱基堆积作用,相邻碱基对会被撑开,双螺旋会局部解螺旋,但总的稳定性是增加的,因为芳香族分子只能和双螺旋的DNA结合。
  • 芳香族分子结合易造成被撑开部位增加一个碱基对,形成移码,因此此类分子大部分是致癌物。
  • EB和DNA结合时,其两个氨基和磷酸基团形成氢键,使DNA局部形成A-DNA结构。
  • 两个EB分子与DNA结合时,插入的位置至少要隔两个碱基对。
  • EB与DNA结合时,会显示出强烈荧光,因此是最常用的DNA探测试剂。
  • 补骨脂素和DNA结合时,若辅以紫外线照射,会与DNA共价相连。

RNA的结构

文件:541.png
图27:tRNA中的罕见碱基
文件:542.png
图28:RNA二级结构中的常见模式
文件:543.png
图29:伪结
文件:544.png
图30:共轴螺旋
文件:545.png
图31:A-minor结构
文件:546.png
图32:二核苷酸平台结构
文件:547.png
图33:发夹亲吻结构
文件:548.png
图34:tRNA的二级结构
文件:549.png
图35:tRNA的三级结构
文件:569.png
图36:核糖体的复杂结构
文件:574.png
图37:DNA拓扑域
文件:575.png
图38:非基本拓扑域结构
文件:576.png
图39A:核小体的结构
文件:599.png
图39B:核小体的结构
  • RNA在细胞中一般以单链存在,其结构比DNA丰富得多。
  • RNA可以和DNA互补配对,两条RNA链也可互补配对,其结构同DNA双螺旋结构。(注意:单链的RNA也会形成螺旋状构象)
  • RNA可以有5'-2'磷酸二酯键,在细胞某些生理过程中会短暂存在此连接方式。
  • RNA中常含有很多罕见碱基,尤其是tRNA中,不但有含氮碱基的修饰,还有糖基的修饰。(图27)
  • RNA的结构常用多个层次来描述。(DNA也适用下述概念)
    • 一级结构就是RNA的共价结构,即其碱基序列。
    • 二级结构是RNA中的氢键连接结构,它反映RNA的局部规则结构,最常见的是反平行双链。
    • 三级结构是RNA中每个原子的位置,它反应RNA的总体结构。
    • 四级结构是多个RNA分子或RNA和蛋白质相结合时的三级结构。
  • RNA的二级结构:
    • RNA中的氢键主要是碱基之间的氢键。
    • RNA的二级结构一般也是碱基反平行配对形成双螺旋结构,但一般呈A-DNA构象。(2‘碳原子上的羟基阻碍了B-DNA构象形成)
    • RNA碱基的基本配对方式同DNA的Watson-Crick配对,但将T换成U,另外有大量非标准配对,如G可和U配对。
    • 相比于DNA,RNA的二级结构中氢键较短,大沟较深(与其它分子结合很多在小沟进行),较稳固,双螺旋较短(但一般的RNA中超过一半的碱基都参与某个局部双螺旋)。
    • 常见RNA二级结构模式见图28,最常见的是发夹结构(Hairpin Loop)。
    • 发夹结构可以短至只有四个碱基,称为Tetraloop。
    • Tetraloop最常见的两种花式:UNCG和GNRA。(N为任意碱基,R为一种嘌呤)
    • 两段双螺旋结构之间有少量不配对的碱基,会形成凸起(Bulge)或内环(Internal Loop)。
    • 只有一条链有不配对碱基,称为凸起,若凸起不止一个碱基,则会形成突出单链螺旋(Extruded Helical Single Strand)。
    • 两条链上都有不配对碱基,称为内环,根据不配对碱基数量是否相等,又分为对称内环(Symmetric Internal Loop)和非对称内环(Asymmetric Internal Loop)。
    • 有时两条链上不配对的两个碱基会堆积,称为交叉链堆积(Cross-strand Stack)。
    • 凸起和内环一般会降低结构的稳定性,但若内环的内部又有G-A非标准碱基对,则结构的稳定性会提升。
    • 凸起和内环是很多蛋白质识别RNA的位点,因为不配对的碱基更容易接触到并识别。
  • RNA的三级结构中的常见模式:
    • 伪结(Pseudoknot):见图29,在很多病毒和某些基因的mRNA出现,会导致翻译时移码,基于此存在表达调控机制,见调控RNA
    • 共轴螺旋(Coaxial Helix):若干个不连续的双螺旋可以通过碱基堆积形成共轴的螺旋,形态上就像一个连续的双螺旋。(图30)
    • 腺嘌呤的小沟一侧可以插入另一碱基对的小沟,特别是C-G的小沟,称为A-minor模式。
    • 一个双螺旋的末尾处,一条链上的两个连续碱基可以弯过来配对,不一定是Watson-Crick配对,其骨架和螺旋的轴几乎垂直,称为二核苷酸平台(Dinucleotide Platform)。(图32)
    • 两个发夹结构的末端环可以“亲吻”,见图33。
  • tRNA的结构:
    • tRNA的二级结构呈四叶草形,三级结构呈L形。
    • tRNA的二级结构有四环四臂:受体臂(Acceptor Arm)、D环和D臂、T环和T臂、反密码子环和臂、可变环(Variable Loop)。
    • 受体臂含tRNA的3’端和5‘端,总是有7个碱基对和4个不配对碱基,3’端的CCA序列高度保守。
    • 反密码子臂总是有5个碱基对,反密码子环总是有7个碱基;T臂和环的数据相同。
    • D臂和环、可变环的长度不一定。
    • 根据可变环的长度,将tRNA分为I类和II类。(I类含4-5个碱基,II类含10-24个碱基)
    • II类tRNA只能携带亮氨酸、丝氨酸、酪氨酸、硒半胱氨酸,只出现在细菌和某些细胞器中。
  • 附:核糖体的结构:
    • 核糖体是RNA和蛋白质的复合体,非常巨大,因此用沉降系数对其组分命名。
    • 原核生物的核糖体(70S)由50S的大亚基和30S的小亚基组成,大亚基由23S和5S的RNA和33个蛋白质组成,小亚基由16S的RNA和21个蛋白质组成。
    • 真核生物的核糖体(80S)由60S的大亚基和40S的小亚基组成,大亚基由28S、5.8S、5S的RNA和49个蛋白质组成,小亚基由18S的RNA和33个蛋白质组成。
    • 蛋白质功能很多,主要是稳定mRNA和rRNA的结合;主要的催化功能都是RNA完成的。

DNA的高级结构

  • 细胞中的DNA需要高度浓缩才能挤入细胞核的狭小空间,这就需要引入DNA的高级结构。
  • DNA高级结构的基本单位是拓扑域(Topological Domain),即两端以共价或非共价方式相连的一段DNA。
  • DNA拓扑域的两种基本类型:环状DNA和用蛋白质将两端相连的DNA。
  • 拓扑域中,从一个碱基出发按一个方向绕一圈回到该碱基,将经过的相邻碱基之间的碱基堆积偏转角相加,再除以360°,称为该拓扑域的连环数(Linking Number,又称连接数),它是刻画拓扑域性质的基本属性。
  • 环状DNA的连环数一定是整数;用蛋白质相连的DNA不一定是。
  • 严格地说,同一个DNA分子具有不同的拓扑域结构,属于构象不同;然而在不打断共价键的情况下不可能实现不同拓扑域结构之间的变换,因此拓扑域结构又有构型的性质;这种现象有时称为拓扑键(Topological Bond)。
  • 拓扑域结构相同的同一个DNA分子,在所有可能连接数中一定有一个能使分子的自由能最小,此时分子最为放松,常用Lk0表示;拓扑域的性质最终是由它的连环数和Lk0的差决定的。
  • 若拓扑域的连接数大于Lk0,则称分子处于正超螺旋(Positive Supercoiling)状态;反之称分子处于负超螺旋(Negative Supercoiling)状态。
  • 细胞中最常见的DNA高级结构是核小体(Nucleosome)。(图39)
    • 核小体呈圆盘状。
    • 核小体的中心有8个蛋白质亚基,其核心是H32-H42四聚体,两侧分别被一个H2A-H2B二聚体夹着。
    • DNA绕着蛋白质逆时针旋转2圈,一共约166个碱基。
    • 相邻的两个核小体之间约有74个碱基,有H1亚基伴随。
    • H1,H2A,H2B,H3,H4都称为组蛋白(Histone)。
  • DNA转录、复制时,局部需要打开超螺旋,此时周围结构会变为负超螺旋;而在同一个拓扑域中,为维持连环数不变,又会在远处形成补偿性的负超螺旋。

核酸的变性

文件:577.png
图40:DNA分阶段变性
文件:578.png
图41:用电子显微镜可观察核酸变性
  • 在极端环境下,核酸的二级结构和更高级结构会遭到破坏,此现象称为核酸的变性(Denaturation),变性不涉及共价键的断裂。
  • 当条件恢复正常时,核酸又会重新自发获得高级结构,称为核酸的复性(Renaturation)。
  • 只要两个单链核酸分子的碱基序列相似就可以复性,不同的两个单链核酸分子复性称为杂交(Hybridization)。
  • 变性的内在因素是核酸的二级结构,G↔C配对所占比例高的核酸比比例低的核酸要求高;长的核酸的变性常分阶段进行,G↔C多的部分先变性。(图40)
  • 总的来说,引起核酸变性的方式比引起蛋白质变性的方式多,但高压下蛋白质易变性而核酸反而被稳定。
  • 核酸变性后,最容易测量的变化是260 nm处紫外吸收上升;其它变化有密度上升、溶液粘度下降、凝胶电泳中运动速度下降。
  • 核酸的变性可用电子显微镜观察,方法是先用甲醛(Formaldehyde)或乙二醛(Glyoxal)处理变性的DNA,修饰打开的部分的含氮碱基的氨基,使它们无法复性,然后染色,最后观察。
  • 引起核酸变性的因素:
    • 温度
      • 加热是最常用的使DNA变性的方法。
      • 一段核酸变性程度达到一半所需的温度称为该核酸的Tm值。
      • Tm值很大程度是由G↔C配对比例决定的,设它所占比例为<math>f_{\mathrm{GC}}</math>,则可用经验公式<math>T_m = (69.3 + 41 f_{\mathrm{GC}})^\circ C</math>估测DNA的Tm值。
      • 细胞中的条件下,核酸碳骨架的磷酸基团带大量负电荷,可吸引阳离子,这会引起局部阳离子浓度增高。
      • 核酸变性时,由于单链可以伸展开来而双链必须保持双螺旋结构,所以局部阳离子浓度会下降。
      • 从热力学角度看,环境中的阳离子浓度越低,核酸变性引起的局部阳离子浓度下降越容易发生。
      • 所以,溶液中的离子浓度升高时核酸的Tm值增大。
      • 核酸吸引的阳离子绝大部分是钠离子,实验表明可用修正的经验公式<math>T_m = (81.5 + 41 f_{\mathrm{GC}} + 16.6 \log[\frac{C_s}{1 + 0.7C_s}])^\circ C</math>估测核酸的Tm值。
    • 变性剂
      • 常用核酸变性剂有:尿素(Urea)、盐酸胍(Guanidinium Chloride)、乙二醇(Ethylene Glycol)、甘氨酸(Glycine)、肌氨酸(Sarcosine)、甜菜碱(Glycine Betaine)、丙酰胺(Propionamide)、乙胺(Formamide)、乙醛(Formaldehyde)。
      • 尿素、盐酸胍、乙二醇会和碱基形成氢键,从而降低它们在水溶液中的疏水效应,使变性在热力学上易于发生。
      • 尿素更倾向于与腺嘌呤和胸腺嘧啶结合。
      • 甘氨酸、肌氨酸、甜菜碱不和核酸单链结合,但被双链核酸强烈排斥,所以它们存在时核酸变性在热力学上难度降低。
      • 乙醛能和碱基的氨基反应,阻止变性的核酸再次复性。
    • pH
      • 正常pH范围内(5-9),只含常见碱基的核酸对pH不敏感。
      • pH过低,不但容易变性,而且容易发生脱嘌呤作用(Depurination)和碳骨架断裂。
      • pH过高时容易变性,但上述化学变化的概率大大降低。
      • 不常见碱基有时对Tm值有显著影响。
    • 核酸类型
      • 双链RNA通常比序列相同的DNA(但U代替T)略稳定。
      • DNA和RNA杂交出的双链分子稳定性比对应的DNA和RNA都低。