新闻与观点
DNA结合蛋白错配
错配是DNA的改变,阻止双螺旋的每条链上的碱基正确对齐。结果表明,错配可以使DNA弯曲成有利的构象,以便与蛋白质结合。
Kale Kundert在美国马萨诸塞州波士顿02138的哈佛大学Wyss生物启发工程研究所工作。

在以下位置搜索该作者:

詹姆斯·S·弗雷泽(James S. Fraser)在美国加利福尼亚大学旧金山分校的加利福尼亚大学旧金山分校,生物工程与治疗科学系,美国94158。
联系

在以下位置搜索该作者:

结合DNA的蛋白质在生物学中无处不在。这些蛋白质以高亲和力结合特定DNA序列的能力通常是其功能的核心,单个突变影响蛋白质结合DNA的能力并不少见。因此,令人惊讶的是,发现许多DNA结合蛋白可以更紧密地结合到被改造成包含一种称为错配的单核苷酸变化的序列上。但这正是阿菲克等。1 报告性质.

即使突变和错配都涉及改变核苷酸的身份,也存在关键区别。 DNA双螺旋的两条链均发生突变。这意味着维持每条链上的DNA碱基之间的碱基配对。但是,仅在一条链上发生错配,因此取消了正常的碱基配对。在正常碱基配对中,腺嘌呤(A)基于DNA双链体对的一条链,互补链上的胸腺嘧啶(T),鸟嘌呤(G)与胞嘧啶(C)对-因此是从A–T的变化一对C–G对是一个突变,而A–C的变化是不匹配。因为错配不是碱基配对的,所以它们比突变更容易使DNA的整体结构变形(图1)。

图1

图1重塑DNA。 The DNA double helix involves pairs of DNA bases: adenine (A) bases on one strand pair with thymine (T) on the other, and guanine (G) bases pair with cytosine (C). a,双螺旋可以存在多种形状,称为构象整体。在此简单示意图中,野生型DNA将采用的主要构象位于最前面,而瞬时可采用的次要构象则是后面的米色阴影。b,突变会将一对碱基变成另一对碱基(例如A–T到C–G)。这种突变不太可能改变可能构象的集合(尽管这种情况偶尔会发生;未显示)。c在不匹配的情况下,仅一个碱基被改变,从而破坏了碱基配对(例如,A–T可能变为A–C)。这种破坏很可能会改变构象整体。d,与蛋白质的结合(红色)也可以改变DNA构象。阿费克等。1 报告指出10%的错配会使DNA弯曲成与蛋白质结合的DNA相比与野生型更相似的构象,从而使蛋白质更易于结合。

合理的假设是DNA的畸变会损害蛋白质的结合,但实际上,它可以通过一种称为形状读出的机制来促进结合特异性。简单来说,形状读取就是蛋白质通过其特征性3D形状间接识别特定DNA序列的能力2,3。这与它们通过每个碱基对中存在的特征化学基团直接识别特定序列的能力相反,这种机制称为碱基读出。人们通常认为DNA具 有相同的形状,而不管其序列如何,但是形状读出是可行的,因为严格来说并非如此。每个序列都有一组优选的构象(称为构象集合),可以以不同的方式或多或少容易地弯曲。利用此优势,需要结合特定序列的蛋白质可以尝试以最与其预期靶标相容的方式弯曲遇到的任何序列。由于弯曲DNA的成本很高,因此这种机制会导致结合亲和力下降。

形状读数在许多蛋白质-DNA相互作用中起作用2,3,但是很难研究其真正的能量成本,因为这样做将需要在不干扰其序列的情况下干扰DNA分子的形状。阿费克等。 认识到不匹配是对序列的微小更改,会导致形状发生较大变化,这是研究此现象的独特方法。

使用错配的DNA并非易事,尤其是在高通量情况下,因为许多标准的分子生物学技术都隐含地认为DNA是完全碱基配对的。因此,作者开发了他们所谓的饱和错配结合测定法(SaMBA),该方法可定量蛋白质与特定DNA序列中每种可能的单核苷酸错配的结合。简而言之,他们制造了一种微芯片,其中排列有单链DNA,该单链DNA编码共有序列的每个可能的单核苷酸变体。每条链都放置在芯片上的已知坐标处。然后,他们允许第二条互补的DNA链流过阵列。互补DNA与印在芯片上的每条链杂交,从而产生具有每种可能错配的双链DNA。最后,作者添加了荧光标记的蛋白质,并使用显微镜观察了其与DNA的结合。他们使用22种不同的DNA阵列和蛋白质进行了测定。

SaMBA不仅揭示了错配可能会改善DNA与蛋白质的结合,而且这种现象相对普遍。 Afek及其同事分析的所有错配中,约有10%会增加蛋白质与该序列结合的亲和力,包括每种蛋白质至少一个这样的序列。对于某些蛋白质,最有效的错配发生在天然靶序列中,从而使蛋白质与该序列的结合更加紧密。对于另一些,最有效的错配发生在非靶序列中,并使蛋白质以与天然靶相当的水平与该序列结合。在这两种情况下,主要是相同的机制:错配付出了扭曲DNA的精力,而蛋白质不必这样做。

请注意,要真正改善结合,错配必须使蛋白质变形,就像通过形状读取机制使蛋白质变形一样。以不同的方式扭曲DNA将削弱结合。错配也不应干扰蛋白质与DNA之间的任何化学接触-尽管作者确实发现错配有时会引入有利的接触。

Afek及其同事的工作拓宽了我们对蛋白质如何与DNA结合的理解,并强调了DNA构象集合在此过程中的重要性。将来,也许自然界中不会出现的核苷酸4 可用于SaMBA中,以彻底探查DNA可以采用的构象阵列,类似于使用非天然氨基酸研究蛋白质生物物理学中细微变化的方式5。 SaMBA也可能适用于寻找旨在与错配或化学修饰的靶标结合的DNA结合蛋白。这类蛋白质很难通过其他方式找到。鉴于大约三分之一的转录因子(调节基因表达的一类重要的DNA结合蛋白)在人类中没有已知的靶序列6,这可能是一条富有成效的查询行。

更广泛地说,错配通常会改善结合的发现可能对诸如癌症等疾病有影响。即使是基因组中的短暂失配也可能促使转录因子在错误的位置结合,从而可能潜在地失调基因并使细胞处于癌性转录状态,即使失配得以修复,这种状态仍然持续。考虑到其暂时的根本原因,将很难研究或确认该想法。但是,明显存在不匹配以改善结合的倾向使得这种机制值得考虑。

参考文献

  1. 1.

    Afek,A。等。 性质 /10.1038/s41586-020-2843-2 (2020).

  2. 2.

    Rohs,R.等。 安努生物化学牧师。 79, 233–269 (2010).

  3. 3.

    萨美(Samee),麻省(H.),布鲁诺(B.G.)& Pollard,K。S.细胞系统 8, 27–42 (2019).

  4. 4.

    Dien,V. T.等。 J.上午化学Soc。 140, 16115–16123 (2018).

  5. 5.

    Zhang W.H.,Otting,G.& 杰克逊(J.Curr。 in结构。生物学 23, 581–587 (2013).

  6. 6.

    兰伯特等。 细胞 172, 650–665 (2018).

下载参考

自然简报

每个工作日都会将重要的科学新闻,观点和分析汇总到您的收件箱中。