• 1. 第三章 引物设计及测序结果分析一、引物设计基础 二、引物设计提高篇 三、 测序结果分析
    • 2. 引物 是一段特定的DNA序列,可以在退火温度下和模版链特异性结合,引导PCR体系中的dNTP根据与模版链碱基配对原则延伸出一条新的链. 引物的序列是根据要扩增的DNA序列而设计的.
    • 3. 引物设计是PCR 技术中至关重要的一环。使用不合适的PCR 引物容易导致实验失败:表现为扩增出目的带之外的多条带(如形成引物二聚体带),不出带或出带很弱,等等。现在PCR 引物设计大都通过计算机软件进行。可以直接提交模板序列到特定网页,得到设计好的引物,也可以在本地计算机上运行引物设计专业软件。
    • 4. 一、引物设计基础引物设计流程: 1)序列查找下载; 2)序列同源性比较; 3)引物设计与筛选; 4)加工修饰; 5)评价分析; 6)实验验证 引物设计原则 引物设计软件
    • 5. 引物的设计以及初步筛选引物的设计与初步筛选基本上通过一些分子生物学软件和相关网站来完成的,目前运用软件primer premier 5或美国whitehead 生物医学研究所基因组研究中心在因特网上提供的一款免费在线PCR引物设计程序primer3来设计引物。
    • 6. 引物设计操作流程 1.序列下载 (序列查找根据所需检测的病原体或者待检特定基因,在http://www.ncbi.nlm.nih.gov/pubmed 网址查询有关序列。 ) ↓ 2.同源性比较 (寻找保守序列设计引物) (在www.ncbi.nlm.nih.gov/blast/blast.cgi 网址进行在线的两两比较) ↓ 3.引物设计筛选
    • 7. 引物设计的原则引物与模板的序列要紧密互补 引物与引物之间避免形成稳定的二聚体或发夹结构 引物不能在模板的非目的位点引发DNA 聚合反应(即错配)。
    • 8. 引物设计基本原则① 引物长度。 ② 碱基随机分布的均衡性。 ③ Tm值 ④ 引物二级结构。 ⑤ 引物3端。 ⑥ 引物5端。 ⑦ 引物的内部稳定性。 ⑧ 自由能分布。
    • 9. 1.引物长度 一般引物的长度为15-30 bp,常用的长度为18-21bp。过长或过短都不合适,为过长会导致其延伸温度大于74℃,不适于Taq DNA聚合酶进行反应,引物过短会引起错配现象,一般来说引物长度大于16bp是必要的。 例如: 一个长度为12bp的引物在人类基因组上存在200个潜在的退火位点(3 x 109/412=200 ).而一个长度为20bp的引物在人基因组上存在的退火位点只有1/400个. 较长的引物(28-35bp),一般是用来区分同源性较高的模板序列或者使用于产生一些突变位点。
    • 10. 2.碱基分布的均衡性同一碱基连续出现不应超过5个 GC含量一般40-60%,以45-55为宜。GC含量太低导致引物Tm值较低,使用较低的退火温度不利于提高PCR的特异性,GC含量太高也易于引发非特异扩增。 有一些模板本身的GC 含量偏低或偏高,导致引物的GC含量不能在上述范围内,这时应尽量使上下游引物的GC 含量以及Tm 值保持接近(上下游引物的GC含量不能相差太大),以有利于退火温度的选择。
    • 11. 3.引物Tm值一般要求:55℃-65℃。 应尽可能保证上下游引物Tm值一致,一般差异控制在2 ℃以内。 (引物的退火温度相差小于5℃一般不会影响PCR的产率,理想情况下一对引物的退火温度是一样的,可以在55℃~70℃间变化)一般采用较低引物Tm值-5℃作为PCR退火温度。 一对引物的GC含量和Tm值应该协调。若是引物存在严重的GC倾向或AT倾向则可以在引物5’端加适量的A、T或G、C尾巴。若G+C含量太低,可在5'端加上一些G或C,若G+C含量太高,可在5'端加上一些A或T。
    • 12. 4.引物二级结构 引物二聚体(引物间不应有多于4个连续碱基的同源性?或互补性 ) 所谓引物二聚体实质上是在DNA聚合酶作用下,一条引物在另一条引物序列上进行延伸所形成的与二条引物长度相近的双链DNA的片段,是PCR常见的副产品,有时甚至成为主要产物。 尽可能避免两个引物分子之间3’端有有较多碱基互补
    • 13. 发夹结构(引物自身连续互补碱基不能大于3bp ) 发夹结构:DNA通过自身回折使得互补的碱基对相遇,也就是引物有部分可以自身配对 尤其是要避免引物3’端形成发夹结构,否则将严重影响DNA聚合酶的延伸。 两引物之间不应该存在互补性,尤应避免3′端的互补重叠以防引物二聚体的形成。一般情况下,一对引物间不应多于4个连续碱基的同源性或互补性。
    • 14. 5.引物3’端引物的延伸从3’端开始,因此3’端的几个碱基与模板DNA均需严格配对,不能进行任何修饰,否则不能进行有效的延伸,甚至导致PCR扩增完全失败。 引物3’端的碱基一般不用A(3’端碱基序列最好是G、C、CG、GC)。另外引物间3’端的互补、二聚体或发夹结构也可能导致PCR反应失败。 3’端的连续3个G 或C ,如GGG或CCC,会导致引物在G+C富集序列区错误引发
    • 15. 6引物5’端引物5’端可以有与模板DNA不配对碱基(对PCR 影响不大),常在5’端引入修饰位点或标记物。 5’端加上限制性核酸内切酶位点序列(酶切位点5’端加上适当数量的保护碱基)。 5’端的某一位点修改某个碱基,人为地在产物中引入该位点的点突变以作研究。 5’端标记放射性元素或非放射性物质(如生物素、地高辛等)。
    • 16. 7.引物的内部稳定性过去认为,引物3’端应牢牢结合在模板上才能有效地进行延伸,故3’端最好为G或C。 现在的观点认为,引物的5’端应是相对稳定结构,而3’端在碱基配对的情况下最好为低稳定性结构,即3’端尽可能选用A或T(有说不适宜用A),少用G或C。 若模板不很清楚,引物3’端最后一个碱基最好为T,其次是G或C,而不选A,国外资料表明,当末位为T时,即使在错配的情况下也能引发链的合成,而末位为A时,错配时引发大大降低,G或C居中,可见,模板很清楚时选A可以提高特异性
    • 17. 8.自由能分布ΔG值(自由能)反映了引物与模板结合的强弱程度。一般3’端ΔG值不要超过9(ΔG值为负值,这里取绝对值),如此则有利于正确引发反应而可防止错误引发。3′末端双链的ΔG是0~-2 kcal/mol时,PCR产量几乎达到百分之百,随着其绝对值的增加产量逐渐下降,在-6时只有40%、到-8时少于20%、而-10时接近于0。 引物的3’端的∆G 值过高,容易在错配位点形成双链结构并引发DNA 聚合反应。
    • 18. 3.1.2常规PCR引物设计实例分析使用BLAST、Primer Premier5 CP(coat protein) 设计CP 引物 【序列查找和下载】
    • 19. (本页无文本内容)
    • 20. (本页无文本内容)
    • 21. (本页无文本内容)
    • 22. (本页无文本内容)
    • 23. (本页无文本内容)
    • 24. (本页无文本内容)
    • 25. 序列同源比较
    • 26. (本页无文本内容)
    • 27. (本页无文本内容)
    • 28. (本页无文本内容)
    • 29. Primer Premier 5.0使用介绍(1)Preimer Premier 启动界面Load sequence
    • 30. 基本信息Sequence nameOriginal sequenceUse these two button to translate the DNA seq to a protein seq or a protein seq to a DAN seq 8种密码子偏好Choose a function
    • 31. 引物设计界面First you can design the primer manuallySense strand or anti-sense strandUseful information of the primer
    • 32. 引物搜索选项设定引物类型搜索模式5’引物位置范围3’引物位置范围产物大小范围引物长度
    • 33. 搜索结果28对引物引物分值 100分为满分每对引物的信息双击选中一对引物
    • 34. 引物信息回到主窗口引物及产物信息是否出现hairpin,dimer,false priming and cross dimer
    • 35. 引物编辑
    • 36. 引物分析首先检查引物二聚体尤其是3’端二聚体形成的可能性。 二项检查是发夹结构(hairpin);与二聚体相同,发夹结构的能值越低越好。 第三项检查为GC 含量,以45-55%为宜。 第四False priming 检查
    • 37. 引物编辑Edit primer hereAnalysis the edit resultAccept the edit result Return to the main window
    • 38. 二、引物设计提高篇 用绿色荧光蛋白(GFP)标记蛋白NR1
    • 39. SPpcDNA3.1NR1Plasmid 1:Plasmid 2GFP
    • 40. SPBamHIpcDNA3.1NR1Plasmid 1:Plasmid 2GFP
    • 41. SPBamHI(GGATCC)pcDNA3.1NR1-1aGFP
    • 42. 121 ggggctccta gagaacccgg gggcgcttga ccgcgcgcgg gcggcccgcg ggtcgtacat 181 cgcgaggtcg tcgcactcgc gcaacccaga gccaggcccg ctgtgcccgg agctcatgag 241 caccatgcac ctgctgacat tcgccctgct tttttcctgc tccttcgcc c gcgcggatcc 301 cgaccccaag atcgtcaaca tcggcgcggt gctgagcacg cgcaagcatg aacagatgtt 361 ccgcgaggca gtaaaccagg ccaataagcg acacggctct tggaagatac agctcaacgc 421 cacttctgtc acccacaagc ccaacgccat acagatggcc ctgtcagtgt gtgaggacct 481 catctctagc caggtctacg ctatcctagt tagccacccg cctactccca acgaccactt 541 cactcccacc cctgtctcct acacagctgg cttctacaga atccctgtcc tgggactgac 601 tacccgaatg tccatctact ctgacaagag tatccacctg agtttccttc gcacggtgcc 661 gccctactcc caccagtcca gcgtctggtt tgagatgatg cgagtctaca actggaacca 721 catcatcctg ctggtcagcg acgaccacga gggacgggca gcgcagaagc gcttggagac 781 gttgctggag gaacgggagt ccaaggcaga gaaggtgctg cagtttgacc caggaaccaa NR1的编码序列(~4000bp)红色为信号肽, 蓝色为BamHI酶切位点, 下划线标出酶切位点的阅读框
    • 43. ATGGTGAGCAAG GGCGAGGAGC TGTTCACCGG GGTGGTGCCC ATCCTGGTCG AGCTGGACGG CGACGTAAAC GGCCACAAGT TCAGCGTGTC CGGCGAGGGC GAGGGCGATG CCACCTACGG CAAGCTGACC CTGAAGTTCA TCTGCACCAC CGGCAAGCTG CCCGTGCCCT GGCCCACCCT CGTGACCACC TTCGGCTACG GCCTGCAGTG CTTCGCCCGC TACCCCGACC ACATGAAGCA GCACGACTTC TTCAAGTCCG CCATGCCCGA AGGCTACGTC CAGGAGCGCA CCATCTTCTT CAAGGACGAC GGCAACTACA AGACCCGCGC CGAGGTGAAG TTCGAGGGCG ACACCCTGGT GAACCGCATC GAGCTGAAGG GCATCGACTT CAAGGAGGAC GGCAACATCC TGGGGCACAA GCTGGAGTAC AACTACAACA GCCACAACGT CTATATCATG GCCGACAAGC AGAAGAACGG CATCAAGGTG AACTTCAAGA TCCGCCACAA CATCGAGGAC GGCAGCGTGC AGCTCGCCGA CCACTACCAG CAGAACACCC CCATCGGCGA CGGCCCCGTG CTGCTGCCTAC CAGTCCGCCC TGAGCAAAGA CCCCAACGAG AAGCGCGATC ACATGGTCCT GCTGGAGTTC GTGACCGCCG CCGGGATCAC TCTCGGCATG GACGAGCTGT ACAAGTAAGFP序列(~700bp)
    • 44. 引物设计要求PCR扩增GFP GFP两边添加BamHI酶切位点 保证NR1的阅读框不改变
    • 45. 5’ ATGGTGAGCAAGGGCGAGGAGC …………TCTCGGCATGGACGAGCTGTACAAGTAA 3’ 3’ TACCACTCGTTCCCGCTCCTCG……………AGAGCCGTACCTGCTCGACATGTTCATT 5’ GFP序列 5’ ATGGTGAGCAAGGGCGAGGAGC …………TCTCGGCATGGACGAGCTGTACAAGTAA 3’ 3’ TACCACTCGTTCCCGCTCCTCG……………CGTACCTGCTCGACATGTTCATT 5’ Primer1: 5’ATGGTGAGCAAGGGCGAGGAGC…………………..AGAGCCGTACCTGCTCGACATGTTCATT 5’ Primer2Primer1: 5’ ATGGTGAGCAAGGGCGAGGAGC…………..Primer2: 5’ TTACTTGTACAGCTCGTCCATGCCGAGA……. Primer1: 5’ ATGGTGAGCAAGGGCGAGGAGC…………..Primer2: 5’ CTTGTACAGCTCGTCCATGCCGAGA……. 第一步:扩增GFP基本序列变性, 引物复性
    • 46. 第二步:GC比值;Tm值Primer1: 5’ ATGGTGAGCAAGGGCGAGGA………….. Primer2: 5’ CTTGTACAGCTCGTCCATGCCGAGA…….Primer1: 5’ ATGGTGAGCAAGGGCGAGGA (GC:60%,Tm:64) Primer2: 5’ CTTGTACAGCTCGTCCATGCC (GC:57%,Tm:66)
    • 47. 第三步:酶切位点Primer1: 5’ ATGGTGAGCAAGGGCGAGGA (GC:60%,Tm:64) Primer2: 5’ CTTGTACAGCTCGTCCATGCC (GC:57%,Tm:66)BamHI: ggatccPrimer1: 5’ ggatccATGGTGAGCAAGGGCGAGGA Primer2: 5’ ggatccCTTGTACAGCTCGTCCATGCC
    • 48. 酶切位点的阅读框 第四步:阅读框atgagcaccatgcacctgctgacattcgccctgcttttttcctgctccttcgcc cgc gcg gat ccc gaccccaag atcgtcaaca tcggcgcggt gctgagcacg cgcaagcatg aacagatgttccgcgaggca gtaaaccagg ccaataagcg acacggctct tggaagatac agctcaacgccacttctgtc acccacaagc ccaacgccat acagatggcc ctgtcagtgt gtgaggacct…..Primer1: 5’ ggatccATGGTGAGCAAGGGCGAGGANR1序列:Primer1: 5’ ggatccTATGGTGAGCAAGGGCGAGGA粘性末端插入后发生GFP读框移码突变
    • 49. AAG是GFP的最后一个密码子,而gat必须作为一个3联体密码,因此引起NR1发生移框突变。atgagcaccatgcacctgctgacattcgccctgcttttttcctgctccttcgcc cgc gcg gat ccc gaccccaag atcgtcaaca tcggcgcggt gctgagcacg cgcaagcatg aacagatgttccgcgaggca gtaaaccagg ccaataagcg acacggctct tggaagatac agctcaacgccacttctgtc acccacaagc ccaacgccat acagatggcc ctgtcagtgt gtgaggacctNR1序列: 5’ ATGGTGAGCAAGGGCGAGGAGC …………TCTCGGCATGGACGAGCTGTACAAGTAA 3’ GFP序列cgc gcg gat ccTATGGTGAGCAAGGGCGAGGAGC ………………………… …TCTCGGCATGGACGAGCTGTACAAGggat ccc gaccccaag atcgtcaaca tcggcgcggt gctgagcacg cgcaagcatg aacagatgttccgcgaggca gtaaaccagg ccaataagcg acacggctct tggaagatac agctcaacgccacttctgtc acccacaagc ccaacgccat acagatggcc ctgtcagtgt gtgaggacct插入GFP后的组合序列
    • 50. Primer2: 5’ ggatccCTTGTACAGCTCGTCCATGCCPrimer2: 5’ gg atc cct CTTGTACAGCTCGTCCATGCC相当于在GFP的最后一个密码子AAG后面加了AG
    • 51. cgc gcg gat ccTATGGTGAGCAAGGGCGAGGAGC ………………………… …TCTCGGCATGGACGAGCTGTACAAGAGg gat ccc gaccccaag atcgtcaaca tcggcgcggt gctgagcacg cgcaagcatg aacagatgttccgcgaggca gtaaaccagg ccaataagcg acacggctct tggaagatac agctcaacgccacttctgtc acccacaagc ccaacgccat acagatggcc ctgtcagtgt gtgaggacct插入GFP后的组合序列
    • 52. 第五步 保护序列 不同内切酶对识别位点以外最少保护碱基数目有要求酶寡核苷酸序列链长切割率%2 hr20 hrAfl IIICACATGTG CCACATGTGG CCCACATGTGGG8 10 120 >90 >900 >90 >90Asc IGGCGCGCC AGGCGCGCCT TTGGCGCGCCAA8 10 12>90 >90 >90>90 >90 >90BamH ICGGATCCG CGGGATCCCG CGCGGATCCGCG8 10 1210 >90 >9025 >90 >90Bgl IICAGATCTG GAAGATCTTC GGAAGATCTTCC8 10 120 75 250 >90 >90BssH IIGGCGCGCC AGGCGCGCCT TTGGCGCGCCAA8 10 120 0 500 0 >90
    • 53. 第五步 在5’端引物保护序列便于酶切Primer1: 5’ GCGGggatccTATGGTGAGCAAGGGCGAGGA Primer2: 5’ GCGCggatccctCTTGTACAGCTCGTCCATGCC
    • 54. 三、 测序结果分析
    • 55. 1、一般一次测序序列的前30个碱基及800以后的只做参考序列。 2、套峰与杂峰 杂峰读出的序列有参考价值。 套峰序列无意义。 3、图上蓝色色块表示碱基可信度。
    • 56. (本页无文本内容)