• 1. 第三章 遗传作图及基因/QTL定位
    • 2. 1、作图群体的建立 建立完整的、高密度的分子遗传图谱是研究数量性状基因的前提。 构建遗传图谱的主要环节包括: ①根据遗传材料之间的多态性确定亲本组合,建立作图群体(作图成功和高效的关键); ②群体中不同植株或品系的标记基因型的分析; ③标记间连锁群的确立。
    • 3. 第一节 作图群体的建立 要构建DNA标记连锁图谱,必须建立作图群体。建立作图群体需要考虑的重要因素包括亲本的选配、分离群体类型的选择及群体大小的确定等。
    • 4. 一、亲本的选配 亲本的选择直接影响到构建连锁图谱的难易程度及所建图谱的适用范围。一般应从四个方面对亲本进行选择, 首先要考虑亲本间的DNA多态性。亲本之间的DNA多态性与其亲缘关系有着密切关系,这种亲缘关系可用地理的、形态的或同工酶多态性作为选择标准。 第二,选择亲本时应尽量选用纯度高的材料,并进一步通过自交进行纯化。 第三,要考虑杂交后代的可育性。亲本间的差异过大,杂种染色体之间的配对和重组会受到抑制,导致连锁座位间的重组率偏低,并导致严重的偏分离现象,降低所建图谱的可信度和适用范围;严重的还会降低杂种后代的结实率,甚至导致不育,影响分离群体的构建。
    • 5. 二、分离群体类型的选择 根据其遗传稳定性可将分离群体分成两大类:一类称为暂时性分离群体,如F2、F3、F4、BC、三交群体等,这类群体中分离单位是个体,一经自交或近交其遗传组成就会发生变化,无法永久使用。另一类称为永久性分离群体,如RI、DH群体等,这类群体中分离单位是株系,不同株系之间存在基因型的差异,而株系内个体间的基因型是相同且纯合的,是自交不分离的。这类群体可通过自交或近交繁殖后代,而不会改变群体的遗传组成,可以永久使用。 构建DNA连锁图谱可以选用不同类型的分离群体,它们各有其优缺点,因此应结合具体情况选用。
    • 6. (一)F2代群体 F2群体是常用的作图群体,迄今大多数植物的DNA标记连锁图谱都是用F2群体构建的。不论是自花授粉植物,还是异花授粉植物,建立F2群体都是容易的,这是使用F2群体进行遗传作图的最大优点。但F2群体的一个不足之处是存在杂合基因型。对于显性标记,将无法识别显性纯合基因型和杂合基因型。由于这种基因型信息简并现象的存在,会降低作图的精度。而为了提高精度,减小误差,则必须使用较大的群体,从而会增加DNA标记分析的费用。 F2群体的另一个缺点是不易长期保存,有性繁殖一代后,群体的遗传结构就会发生变化。为了延长F2群体的使用时间,一种方法是对其进行无性繁殖,如进行组织培养扩繁。但这种方法不是所有的植物都适用,且耗资费工。另一种方法是使用F2单株的衍生系(F3株系或F4家系)。将衍生系内多个单株混合提取DNA,则能代表原F2单株的DNA组成。为了保证这种代表性的真实可靠,衍生系中选取的单株必须是随机的,且数量要足够多。这种方法对于那些繁殖系数较大的自花授粉植物(如水稻、小麦等)特别适用。
    • 7. (二)BC1群体 BC1(回交一代)也是一种常用的作图群体。BC1群体中每一分离的基因座只有两种基因型,它直接反映了F1代配子的分离比例,因而BC1群体的作图效率最高,这是它优于F2群体的地方。 虽然BC1群体是一种很好的作图群体,但它也与F2群体一样,存在不能长期保存的问题。可以用F2中使用的类似方法来延长BC1群体的使用时间。另外,对于一些人工杂交比较困难的植物,BC1群体也不太合适,因为一是难以建立较大的BC1群体,二是容易出现假杂种,造成作图的误差。
    • 8. (三)RI群体 RI(重组自交系)群体是杂种后代经过多代自交而产生的一种作图群体,通常从F2代开始,采用单粒传的方法来建立。由于自交的作用是使基因型纯合化,因此,RI群体中每个株系都是纯合的,因而RI群体是一种可以长期使用的永久性分离群体。理论上,建立一个无限大的RI群体,必须自交无穷多代才能达到完全纯合;建立一个有限大小的RI群体则只需自交有限代。然而,即使是建立一个通常使用的包含100~200个株系的RI群体,要达到完全纯合,所需的自交代数也是相当多的。 建立RI群体是非常费时的。在实际研究中,人们往往无法花费那么多时间来建立一个真正的RI群体,所以常常使用自交6~7代的“准”RI群体。
    • 9. 在RI群体中,每一分离座位上只存在两种基因型,且比例为1:1。 RI群体的优点是可以长期使用,可以进行重复试验。因此它除了可用于构建分子标记连锁图外,特别适合于数量性状基因座(QTL)的定位研究。但是,考虑到构建RI群体要花费很长时间,如果仅是为了构建分子标记连锁图的话,选用RI群体是不明智的。另外,异花授粉植物由于存在自交衰退和不结实现象,建立RI群体也比较困难。
    • 10. (四)DH群体 高等植物的单倍体(Haploid)是含有配子染色体数的个体。单倍体经过染色体加倍形成的二倍体称为加倍单倍体或双单倍体(DH)。DH植株是纯合的,自交后即产生纯系,因此DH群体可以稳定繁殖,长期使用,是一种永久性群体。 DH群体直接从F1花粉经培养产生,因而建立DH群体所需时间不多。但是,产生DH植株有赖于花培技术。有些植物的花药培养非常困难,就无法通过花培来建立DH群体。另外,植物的花培能力跟基因型关系较大,因而花培过程会对不同基因型的花粉产生选择效应,从而破坏DH群体的遗传结构,造成较严重的偏分离现象,这会影响遗传作图的准确性。因此,如果是以构建分子标记连锁图为主要目的的话,DH群体不是一种理想的作图群体。
    • 11. 利用重组自交系间互交构建的永久性F2群体(Immortalized F2),具有以下突出优点: ①基因型组成类似于F2群体, 具有丰富的遗传信息; ②与F2每种基因型仅一个单株相比,永久性F2群体可有大量植株为同一基因型。 该群体兼具F2和永久性作图群体的优势,为遗传研究提供了新的材料类型。
    • 12. 遗传图谱的分辨率和精度,很大程度上取决于群体大小。群体越大,则作图精度越高。但群体太大,不仅增大实验工作量,而且增加费用。因此确定合适的群体大小是十分必要的。在实际工作中,构建分子标记骨架连锁图可基于大群体中的一个随机小群体(如150个单株或家系),当需要精细地研究某个连锁区域时,再有针对性地在骨架连锁图的基础上扩大群体。这种大小群体相结合的方法,既可达到研究的目的,又可减轻工作量。 总的说来,在分子标记连锁图的构建方面,为了达到彼此相当的作图精度,所需的群体大小的顺序为F2>RI>BC1和DH。三、群体大小的确定
    • 13. 3、QTL定位的方法 QTL定位就是检测分子标记与QTL间的连锁关系,同时还可以估计QTL的效应。 利用DNA标记进行QTL定位的遗传学基础是:当分子标记与某一个性状的QTL连锁时,不同标记基因型的个体的表型值将存在显著差异,分析这种差异,就可推断与分子标记相连锁的QTL的位置和方法。 与饱和遗传图谱的构建相适应,QTL定位的统计分析方法也在不断发展。
    • 14. 3.1 单标记分析法 单标记分析法就是通过t 测验、方差分析、回归分析、似然比测验或最大似然估计,比较某一标记不同基因型数量性状表型值间的差异,如果差异显著,则说明控制数量性状的QTL与该标记有连锁,进而估计其效应。 单标记分析法有一个显著的优点,即不需要完整的标记连锁图,因而早期的QTL定位研究多采用这种方法。
    • 15. 但传统的单标记分析方法存在许多缺点: ①不能确定标记是与一个QTL连锁还是与几个QTL连锁; ②无法确切估计QTL的可能位置; ③遗传效应与重组率混合在一起,导致低估了QTL的遗传效应; ④容易出现假阳性; ⑤检测效率不高,所需的个体数较多, ⑥对于某标记而言,基因型缺失的个体必须剔除。
    • 16. 3.2区间作图法(Interval mapping, IM) 鉴于单标记方法存在的问题,Lander 和Bostein(1989)提出了基于两个侧邻标记的区间作图法。
    • 17. 该方法借助于完整的分子标记连锁图谱,计算基因组任意位置上两个相邻标记之间存在或不存在QTL的似然比的对数(LOD值)。 根据整个染色体上各点处的LOD值可以检测出一个QTL在该染色体上存在与否的似然图谱。当LOD值超过某一给定的临界值时,即表明存在一个QTL, 其置信区间为对应于峰两侧各下降1个LOD值的图谱区间。
    • 18. 与单标记分析法相比,区间作图法具有以下优点: ①能从支持区间推断QTL的可能位置; ②可利用标记连锁图在全基因组系统地搜索QTL,假如一条染色体上只有一个QTL,QTL的位置和效应估计渐近于无偏; ③QTL检测所需的个体数大大减少。区间作图法一度成为QTL作图的标准方法。
    • 19. 但区间作图法仍存在许多问题: 无法检测上位性效应和基因型与环境的互作; 当相邻QTL相距较近时,QTL间相互干扰使QTL的位置和效应估计出现偏差; 每次检验仅用两个标记,其他标记的信息未加利用。
    • 20. 3.3 复合区间作图法(Composite Interval Mapping, CIM) 复合区间作图法是Zeng系统研究了多元线性回归方法(一个因变量和多个自变量间的相关关系)进行QTL作图的理论基础,进而提出把多元回归与区间作图结合起来的QTL定位方法。 该方法中拟合了其它遗传标记,即在对某一特定标记区间进行检测时,将其它与QTL连锁的标记也拟合在模型中以检测背景遗传效应。
    • 21. 复合区间作图法的主要优点是: ①仍采用QTL似然图来显示QTL的可能位置及显著程度,从而保持了区间作图法的优点; ②一次只检验一个区间,把对多个QTL的多维搜索降低为一维搜索; ③假如不存在上位性和QTL与环境互作,QTL的位置和效应估计是渐近无偏的; ④以所选择的多个标记为条件,在较大程度上控制了背景遗传效应,提高了作图的精度和效率。
    • 22. 复合区间作图法也存在一些问题,主要有: 不能分析上位性及QTL与环境互作等复杂的遗传效应;
    • 23. 3.4多重区间作图法(Multiple Interval Mapping, MIM) Kao 和Zeng等(1999)提出了多重区间作图法进行基因定位,这种方法也是以极大似然法估算遗传参数,突破了回归方法的局限性, 可同时在多个区间上检测多个QTL,使QTL作图的精确度和有效性得到了改进。 利用MIM法还能估计和分析QTL之间的上位性、个体的基因型值和数量性状的遗传力。但其计算相当复杂,而且如何确定合适的临界值目前尚无理论支持。
    • 24. 3.5基于混合线性模型的复合区间作图法(Mixed Composite Interval Mapping) 朱军提出了用随机效应的预测方法获得基因型效应及基因型与环境互作效应,然后再用区间作图法进行遗传主效应及基因型与环境互作效应的QTL分析。
    • 25. 该模型可以扩展到分析具有加×加、加×显、显×显上位性的各项遗传主效应及其与环境互作效应的QTL。 利用这些效应估计值,可预测基于QTL 主效应的普通杂种优势和基于QTL 与环境互作效应的互作杂种优势。 但该模型在检测上位性效应、基因型与环境互作效应的灵敏度有限,不同重复资料间的吻合性不高。
    • 26. Name Source Companion program① Functions② Designs③ Mapmaker/QTL ftp://genome.wi.mit.edu/pub/mapmaker3 Mapmaker/Map manager QT SIM/CIM BC,F2,F3 QTL Cartographer http://statgen.ncsu.edu/qtlcart/ Mapmaker/Map manager QT SIM/CIM,PT BCx,SFx,RFx,RI,others Map manager QT http://mcbio.med.buffalo.edu/mapmgr.html QTL Cartographer/Mapmaker/Qgene SIM/CIM,PT BC,F2,RI QGeneTM qgene@clarityconnect.com Map manager QT SIM,PT BCx,F2,F3,DH,others MapQTLTM http://www.cpro.dlo.nl/cbw/ Joinmap SIM/CIM,PT BC,F2,Risx,DH,CP PLABQTL http://www.unihohenheim.de/-ipspwww/soft.html - SIM/CIM BC,F2,SFx MQTL ftp://gnome.agrenv.mcgill.ca/pub/genetics/ - sCIM,PT BC,DH,RI Multimapper http://www.RNI.Helsinki.FI/~mjs/ QTL Cartographer/Mapmaker CIM BC,F2 The QTL Café http://sun1.bham.ac.uk/g.g.seaton/ QTL Cartographer/Joinmap SIM BC,F2,DH,RI Epistat http://www.larklab.4biz.net/epistat.htm spreadsheet program PT BC,RI QTLMapper http://ibi.zju.edu.cn/software/qtlmapper/   MCIM BC,F2,DH,RI Joinmap http://www.kyazma.nl/?mc=JoinMap&sc=Download Mapmaker   BC,F2,DH,RI
    • 27. 4、作物QTL定位研究进展 随着遗传图谱的日益饱和以及QTL定位方法的不断完善,植物QTL定位研究发展很快,从模式植物水稻、拟南芥的深入研究逐步扩展到玉米、小麦、大豆、棉花等重要作物的诸多重要性状(表3)。
    • 28. Plant/Crop Trait Author Year Arabodopsis Fruit number, Bolting date, Flowering date Weinig C et al. 2003 Rice Branching, floret formation, and pre-flowering floret abortion of rice panicle Yamagishi J. 2004   Developmental behavior of plant height Cao G. 2001   Paste viscosity characteristics Bao J.S. 2000   Seed dormancy and heading date Lin á S. Y. 1998 Barley Callus growth,subsequent shoot differentiation ratio and green shoot ratio in immature embryo culture Mano Y. et al. 2002   Resistance against powdery mildew; resistance against leaf rust Backes G. ·et al. 2003 Maize Grain yield, grain moisture,plant height Ho J.C. et al. 2002   Grain dry milling properties, composition and vitreousness Séne M. 2001   Downy mildew resistance Agrama H.A. 1999   Resistance to Sporisorium reiliana Lübberstedt T. 1999 Wheat Fusarium head blight resistance Buerstmayr H. 2003   Grain protein content Prasad M. 2003 Tomato Physical and chemical traits Saliba-Colombani V. 2001 Cotton Yield and fiber quality traits Ullo M 2005   Fiber-related traits Mei M 2004   Fiber strength Zhang TZ 2003   Agronomic and fiber quality traits Ullo M 2000
    • 29. 4.1效应相反QTL的分布 不同效应的QTL在各个亲本中的分布较复杂,许多研究表明,在亲本中存在对立效应的QTL,即在高值亲本中有减效QTL,低值亲本中有增效QTL。 有的“感”品种竟含有“极抗”的QTL,其效应比“抗”品种中的“抗”QTL还大,只是被紧密连锁的“感”QTL所掩盖,发生重组后才可能被检测出来。 这可能是由于不利连锁所致,它解释了数量性状超亲分离的原因。
    • 30. 4.2 QTL动态定位 按照发育遗传学的理论,基因在个体发育的不同阶段是有选择性表达的。不同发育阶段数量基因的表达容易受到与其它基因及与环境互作的影响。数量性状的遗传表达与发育阶段密切相关,存在基因表达的发育阶段性,不同发育阶段的性状变化是基因的选择性有序表达的结果。
    • 31. 吴为人等针对基因在个体发育不同阶段的选择性时空表达提出了QTL动态定位(dynamic mapping),并利用水稻分蘖模式进行了动态定位研究。 其他研究者利用水稻株高、水稻干物质和叶挺长、水稻最大根长也进行了类似的研究。
    • 32. 研究数量性状在发育不同时段的基因表达和效应进行,有助于揭示数量性状发育的分子遗传机理。QTL的动态定位能揭示QTL的动态表达,从而可以提高定位的效率。
    • 33. 4.3 分离群体分组分析方法的应用 Michelmore(1991)提出分离群体分组分析方法(BSA法)作为快速鉴别与特定质量性状基因或染色体区域相连锁的标记已得到广泛的应用; 将高值和低值两组个体的DNA分别混合,形成两个DNA池,然后检测两池间的遗传多态性。在两池间表现出差异的分子标记即被认为与QTL连锁。从而可以大幅度减少需要检测的DNA样品的数量。 但该法只能用于单个性状的QTL分析,且灵敏度和精确度都较低,一般只能检测出效应较大的QTL。
    • 34. 4.4 QTL比较定位 相关物种的基因组是由共同的原始基因组进化而来,因而它们彼此之间存在着一定程度的相似性。相关物种的基因组在某些区段上具有共线性,在进化过程中基因的排列顺序相当保守。因而可以采用同样一套DNA探针,比较不同物种相似性状的QTL在连锁图上的位置,这就是QTL的比较定位。
    • 35. 5、QTL的精细定位及克隆 对QTL研究的一个重要目标就是将QTL上的基因克隆分离出来,用于基因工程操作。 目前用于QTL定位的群体一般为初级定位群体,大多数QTL定位的精度只在10-20cM,这一精度无法区分是单个基因还是多个QTL位点连锁的多基因成分。对于克隆来说还太粗糙。而且这一基因组区域很可能包含控制同一性状的几个相反的QTL,这势必影响改良的性状在这一区域的遗传获得量和育种值。
    • 36. 要提高基于QTL的选择效果,就必须构建次级定位群体,消除群体内背景遗传因子的干扰。这些群体包括: 近等基因系(near isogenic lines, NIL)、 回交近交系群体(backcross inbred lines, BIL) 单片段代换系群体(single segment substitution lines, SSSL)等。
    • 37. 这类群体是由供体亲本与受体亲本经过多代回交以后选育形成的,株系间除目的性状外遗传背景基本一致。 可以将遗传背景的干扰效应降低至最小,极大地提高QTL定位的精度。在此基础上,通过染色体登陆和行走,最终可以实现QTL的克隆。
    • 38. Martin等(1993)首次报道了以图谱为基础的基因克隆在植物上的应用:利用抗病、感病的近等基因系杂交获得F2群体,最终获得了抗番茄茎腐病的主效基因PTO; 其它作物上也有许多重要性状主效QTL的精细定位和克隆。
    • 39. 目前作物上定位的诸多QTL 还很难付诸育种实践,这是因为连锁作图在分析数量性状基因方面存在一些问题:(1) QTL 检测主要依赖一个或少数几个亲本组合,以此进行MAS不能有效利用更多的种质资源和更广泛的遗传多样性。 (2)来自于种间杂交群体定位的QTL,难以直接应用于陆地棉的MAS;而来自陆地棉种内杂交群体定位的QTL,具有较强的“群体专一性”,在其他育种群体后代中进行MAS 时仍然存在一定的困难。大多数QTL 尚需在育种亲本和种质资源群体中进一步证实。
    • 40. 近年来,应用关联作图(Association mapping,AM)解析植物数量性状基因已成为目前国际植物基因组学研究的热点之一。关联作图又称关联分析(Association analysis)或连锁不平衡作图(Linkage disequilibrium mapping,LDmapping),曾广泛应用于人类遗传学研究中(Ruth 等,1999)。一般以群体结构非固定的自然群体(种内)或种质资源群体为研究对象,以长期重组后保留下来的基因(位点)间连锁不平衡为基础,在获得群体表型数据与基因型数据后,采用统计方法检测遗传多态性与性状可遗传变异之间的关联(Mackay 等,2007)。关联作图已引起种质资源研究者的重视,在玉米(Yang 等,2010)、水稻(Shao 等,Online)、小麦(Yao 等,2009)、大豆(Hyten 等,2007)、大麦(Massman 等,Online)等作物上,研究者已将传统的形态学数据与分子标记结合,探查数量性状的QTL 或QTN(Quantitative trait nucleotides)。
    • 41. 以玉米为例,美国科学基金会(NSF)于 2004 年启动了一个大型研究项目―玉米基因组的结构和功能多样性研究‖,试图从两方面来弥补连锁作图的不足,一是筛选最有代表性的玉米自交系材料,并组配了 25 个RIL 群体,对自交系和RIL 群体进行多年多点的田间试验和性状评估,通过全基因组的标记分析以便发现更多的QTL;二是对大量候选基因进行基于连锁不平衡的关联作图,以确定基因的功能并寻找最优等位基因。
    • 42. 连锁作图和关联作图在挖掘数量性状基因方面都具有重要的作用,它们在QTL 定位的精度和广度、提供的信息量、统计分析方法等方面具有明显的互补性,连锁作图可以初步定位控制目标性状基因的位臵,而关联作图则可快速对目标基因进行精细定位,并针对特定候选基因提供大量信息,验证候选基因功能。结合连锁作图和关联作图的优点,分别从纵向和横向对数量性状进行剖分,将加快数量性状基因的鉴定和分离克隆,为深入认识数量性状的遗传学和分子生物学基础以及作物数量性状的遗传改良提供新的契机。因此,结合连锁作图与关联作图将大大促进数量性状遗传基础的解析。