整理:详细介绍引物设计原则

引物设计原则一:

1. 引物的长度一般为15-30 bp,常用的是18-27 bp,但不应大于38,因为过长会导致其延伸温度大于74℃,不适于Taq DNA聚合酶进行反应。

2. 引物序列在模板内应当没有相似性较高,尤其是3’端相似性较高的序列,否则容易导致错配。引物3’端出现3个以上的连续碱基,如GGG或CCC,也会使错误引发机率增加。

3. 引物3’端的末位碱基对Taq酶的DNA合成效率有较大的影响。不同的末位碱基在错配位置导致不同的扩增效率,末位碱基为A的错配效率明显高于其他3个碱基,因此应当避免在引物的3’端使用碱基A。另外,引物二聚体或发夹结构也可能导致PCR反应失败。5’端序列对PCR影响不太大,因此常用来引进修饰位点或标记物。

4. 引物序列的GC含量一般为40-60%,过高或过低都不利于引发反应。上下游引物的GC含量不能相差太大。

5. 引物所对应模板位置序列的Tm值在72℃左右可使复性条件最佳。Tm值的计算有多种方法,如按公式Tm=4(G+C)+2(A+T),在Oligo软件中使用的是最邻近法(the nearest neighbor method)。

6. ΔG值是指DNA双链形成所需的自由能,该值反映了双链结构内部碱基对的相对稳定性。应当选用3’端ΔG值较低(绝对值不超过9),而5’端和中间ΔG值相对较高的引物。引物的3’端的ΔG值过高,容易在错配位点形成双链结构并引发DNA聚合反应。

7. 引物二聚体及发夹结构的能值过高(超过4.5kcal/mol)易导致产生引物二聚体带,并且降低引物有效浓度而使PCR反应不能正常进行。

8. 对引物的修饰一般是在5’端增加酶切位点,应根据下一步实验中要插入PCR产物的载体的相应序列而确定。

9. 引物序列应该都是写成5-3方向的,Tm之间的差异最好控制在1度之内,另外我觉得扩增长度大一些比较好,500bp左右。

引物设计原则二:
要设计引物首先要找到DNA序列的保守区。同时应预测将要扩增的片段单链是否形成二级结构。如这个区域单链能形成二级结构,就要避开它。如这一段不能形成二级结构,那就可以在这一区域设计引物。

① 引物应用核酸系列保守区内设计并具有特异性。

② 产物不能形成二级结构。

③ 引物长度一般在15~30碱基之间。

④ G+C含量在40%~60%之间。

⑤ 碱基要随机分布。

⑥ 引物自身不能有连续4个碱基的互补。

⑦ 引物之间不能有连续4个碱基的互补。

⑧ 引物5′端可以修饰。

⑨ 引物3′端不可修饰。

⑩ 引物3′端要避开密码子的第3位。

引物设计原则三:

1.引物的特异性 引物与非特异扩增序列的同源性不要超过70%或有连续8个互补碱基同源。

2.避开产物的二级结构区 某些引物无效的主要原因是引物重复区DNA二级结构的影响,选择扩增片段时最好避开二级结构区域。用有关计算机软件可以预测估计mRNA的稳定二级结构,有助于选择模板。实验表明,待扩区域自由能(△G°)小于58.6lkJ/mol时,扩增往往不能成功。若不能避开这一区域时,用7-deaza-2′-脱氧GTP取代dGTP对扩增的成功是有帮助的。

3.长度 寡核苷酸引物长度为15~30bp,一般为20~27mer。引物的有效长度:Ln=2(G+C)+(A+T),Ln值不能大于38,因为>38时,最适延伸温度会超过Taq DNA聚合酶的最适温度(74℃),不能保证产物的特异性。

4.G+C含量 G+C含量一般为40%~60%。其Tm值是寡核苷酸的解链温度,即在一定盐浓度条件下,50%寡核苷酸双链解链的温度,有效启动温度,一般高于Tm值5~10℃。若按公式Tm=4(G+C)+2(A+T)估计引物的Tm值,则有效引物的Tm为55~80℃,其Tm值最好接近72℃以使复性条件最佳。

5.碱基础随机分布 引物中四种碱基的分布最好是随机的,不要有聚嘌呤或聚嘧啶的存在。尤其3′端不应超过3个连续的G或C,因这样会使引物在G+C富集序列区错误引发。

6.引物自身 引物自身不应存在互补序列,否则引物自身会折叠成发夹状结构牙引物本身复性。这种二级结构会因空间位阻而影响引物与模板的复性结合。若用人工判断,引物自身连续互补碱基不能大于3bp。

7.引物之间 两引物之间不应不互补性,尤应避免3′端的互补重叠以防引物二聚体的形成。一对引物间不应多于4个连续碱基的同源性或互补性。

8.引物的3′端 引物的延伸是从3′端开始的,不能进行任何修饰。3′端也不能有形成任何二级结构可能,除在特殊的PCR(AS-PCR)反应中,引物3′端不能发生错配。 在标准PCR反应体系中,用2U Taq DNA聚合酶和800μmol/L dNTP(四种dNTP各200μmol/L)以质粒(103拷贝)为模板,按95℃,25s;55℃,25s;72℃,1min的循环参数扩增HIV-1 gag基因区的条件下,引物3′端错配对扩增产物的影响是有一定规律的。A∶A错配使产量下降至1/20,A∶G和C∶C错七下降至1/100。引物A:模板G与引物G:模板A错配对PCR影响是等同的。

9.引物的5′端 引物的5′端限定着PCR产物的长度,它对扩增特异性影响不大。因此,可以被修饰而不影响扩增的特异性。引物5′端修饰包括:加酶切位点;标记生物素、荧光、地高辛、Eu3+等;引入蛋白质结合DNA序列;引入突变位点、插入与缺失突变序列和引入一启动子序列等。

 10.密码子的简并 如扩增编码区域,引物3′端不要终止于密码子的第3位,因密码子的第3位易发生简并,会影响扩增特异性与效率。

引物设计原则四:
【1】引物的长度以15-30bp为宜,否则会影响扩增的特异性。

【2】 】碱基尽可能随机分布,避免相同的碱基成串排列,引物的G+C含量在40%-60%之间,若G+C含量太低,可在5’端加上一些G或C,若G+C含量太高,可在5’端加上一些A或T。

【3】 应避免每条引物内部形成二级结构及两条引物的3’端互补形成引物二聚体,避免在引物的3’端有3个G或3个C成串排列,3’端的末位碱基最好选T、C、G,而不选A,也有建议在引物的两端用1-2个嘌呤碱基。

【4】 尽可能使用两条引物的Tm值相同(最好相差不要超过5℃),退火温度根据较低的Tm值选定,也可以通过改变引物的长度来平衡两条引物的退火温度。Tm值可以根据Tm=4(G+C)+2(A+T)计算。而对于较长的引物,Tm值需要考虑动力学参数、从“最近邻位”的计算方式得到,现有的PCR引物设计软件大多数都采用这种方式。(注:对于Tm值的计算有争议的地方是附加序列应不应该计算在内,我觉得有值得商讨的地方。因为从理论上只有最开始的循环引物的附加序列是不与模板链结合的,而在后来的PCR反应中,引物的附加序列是和模板链结合了的。)

【5】 引物的3’端要与模板严格配对,而5’端碱基没有严格的限制,只要与模板DNA结合的部分足够长,其5’端碱基可不与模板DNA配对而呈游离状态,这样,我们可以在引物的5末端加上酶切位点(引入酶切位点时,要考虑到进行双酶切的共用缓冲液,否则给下游工作带来困难)、启动子,方便下游操作。

【6】 不要在扩增序列的二级结构区设计引物,以免退火困难。也要考虑引物设计处模板的特异性。

~完~

详细请看 引物设计专题