phytozome里引物blast结果怎么看特不特异

徐志军 赵胜 胡小文 孔冉 苏俊波 刘洋

摘  要:分子標记缺乏是制约甘蔗分子标记技术发展的重要因素。本研究利用甘蔗AP85-441和R570基因组参考序列,使用MISA软件分别鉴定出512 835和97 839个微卫星位点,分别占割手密基因组(AP85-441)和甘蔗基因组(R570)高质量参考序列的0.32%和0.35%。在2个基因组序列中,优势重复单元均为单核苷酸、二核苷酸和三核苷酸,各重复单元均以AT富集的基元为主。割手密和甘蔗基因组序列中分别有472 117和89 748个位点可以开发SSR标记。对割手密、甘蔗与高粱基因进行同源性分析,分别鉴定出16 691个和13 271个对应到高粱1~10号染色体上的同源基因,利用基因序列中的SSR位点,开发出13 224和7624对SSR引物。对开发的引物分别以割手密和甘蔗基因组为模板进行e-PCR检测,这些引物在割手密基因组中以多位点扩增为主,在2个基因组中的有效标记比例分别为79.35%和36.13%、79.01%和93.36%。部分SSR引物在基因组中表现出特异性扩增,有1368对仅在AP85-441中单扩增,有1420对仅在R570序列中单扩增,共有752对SSR引物可在2个基因组中单扩增,且这些SSR的扩增位点和来源基因均分布于所在基因组的全部染色体上。在禾本科作物基因组中e-PCR检测表明,开发的单扩增SSR标记具有较好的特异性。本研究鉴定的SSR位点,有助于进一步丰富甘蔗的分子标记;开发的3540对SSR引物对于栽培种甘蔗遗传图谱构建中遗传来源区分和同源连锁群确定具有重要的参考意义。

关键词:甘蔗;微卫星序列;同源基因;SSR标记;特异扩增

SSR),是一类在植物基因组中广泛存在的以少数几个核苷酸(1~6个)为单位重复构成的DNA片段,多位于基因非编码区,两端多是单拷贝且具有一定保守性的序列。基于微卫星位点其特性开发的分子标记称为SSR标记,具有分布广泛、共显性和多态性好、分辨率高、重复性好的特点,分析过程简单、实验结果可靠,因而被广泛的应用于作物的遗传多样性分析、指纹图谱构建、杂种鉴定、遗传图谱构建、基因挖掘研究等方面。

栽培种甘蔗(Saccharum spp.)是我国最为重要的糖料作物,在我国热带和亚热带地区广泛种植。由甘蔗制取的蔗糖是我国人民食用蔗糖的主要来源(占比90%以上)。我国甘蔗种植面积在1.33×106 hm2左右。由于我国甘蔗种植区域和种植总面积的限制,加之栽培种甘蔗复杂的基因组结构制约着甘蔗基因组学和育种学的发展[1],尽管我国是世界第3大食用蔗糖生产国,我国每年仍需进口大量的食用蔗糖[2-3]。在过去20年里,分子遗传学的发展和进步促进了对甘蔗基因组的全面认识,基于RAPD、AFLP、SSR等分子标记的低密度不饱和遗传图谱[4-13]、重要性状的QTL定位研究[14-17]、全基因组关联分析[18-20]先后展开以期建立甘蔗性状-标记技术体系从而加速甘蔗育种进程。然而,栽培种甘蔗基因组极其复杂,解析难度远超大多数作物,其基因组具有异源多倍体、非整倍体的特性,基因组约为10 GB。相较于甘蔗基因组,现有的甘蔗分子标记,特别是用于高密度遗传图谱构建和重要功能基因挖掘的分子标记还太少,限制了甘蔗重要性状关联功能基因的挖掘和辅助选择标记的开发,从而导致基于分子标记技术的甘蔗遗传改良研究进展缓慢。

运用最新的测序技术和组装策略,甘蔗基因组在2018年取得重要进展:甘蔗祖先种割手密(Saccharum spontaneum L.)最小單倍体AP85- 441(1n=4x=32, 3.5 GB)基因组完成测序[21],且利用甘蔗基因组与高粱基因组的共线性,获得了基于BAC文库的栽培种甘蔗R570嵌合单倍体高质量序列(530.7 Mb)[22]。这些基因组信息的发布,为大规模分子标记的开发提供了大量可利用数据。基于此,本研究利用AP85-441和R570基因组序列信息,鉴定基因组中的微卫星位点,进一步丰富甘蔗的分子标记;并利用甘蔗基因组与高粱基因组的同源性,开发可用于遗传图谱遗传来源划分和同源连锁群锚定的SSR标记,为甘蔗重要功能基因的挖掘和分子标记辅助育种奠定基础。

http://pgrc.ipk-gatersleben.de/misa/)分别搜索AP85-441全基因组、R570基因组高质量参考序列、AP85-441单套染色体基因序列中的微卫星序列SSR,并对SSR重复基序类型进行特征分析。查找标准为单核苷酸基序至少重复次数为10,而2、3、4、5和6核苷酸基序最少重复次数分别为6、5、5、5和5。使用Primer 3.0软件对SSR位点进行引物设计,每个SSR位点分别设计3组引物,并且满足以下的特征:(1)长度在15~25 bp范围内;(2)PCR扩增产物长度为100~400 bp;(3)退火温度(Tm值)在50~60 ℃之间;(4)GC的含量在40%~60%;(5)避免出现发夹结构及引物二聚体。

toolkit)软件,分析割手密基因、栽培种甘蔗基因和高粱基因三者之间的同源性。

使用e-PCR Version: 2.3.9(http://www.ncbi. nlm.nih.gov/tools/epcr/)对设计的引物进行电子PCR检测,参数设置按照Deng等[23]的方法进行。分别分析同源基因开发的SSR引物在甘蔗、割手密基因组中的扩增情况,统计并记录引物在基因组上的扩增次数,剔除扩增产物长度500 bp及特异性不好的引物。筛选出的单扩增SSR标记在水稻、玉米和高粱基因组中进行e-PCR检测特异性。

2.1  割手密基因组和甘蔗基因组参考序列中SSR位点分布及结构特点

利用割手密AP85-441基因组序列和甘蔗R570嵌合单倍体高质量序列鉴定出具有单核苷酸~六核苷酸重复单元类型的微卫星位点,其中从割手密3.13 Gb的基因组和甘蔗530.7 Mb的基因组参考序列中分别鉴定出512 835和97 839个微卫星位点,分别包含37 090和7383个复合位点。鉴定出的微卫星序列分别占割手密基因组和甘蔗基因组高质量参考序列的0.32%和0.35%,平均每6.10 kb和5.42 kb出现1个微卫星位点。

从割手密和甘蔗基因组序列中分别鉴定出6种重复单元类型的基序种类分别为1949和1062种,基序种类随重复单元核苷酸数的增加而增加,分别为4、12、60、231、662、980种和4、12、60、210、368、408种(表1和表2)。在2个基因组序列中,各重复单元组成的SSR数量上存在着较大差异,但均以单核苷酸、二核苷酸和三核苷酸为主,分别占全部SSR位点的96.74%和96.19%。在2个基因组中,各重复单元优势基序类型随着重复单元增加,在所属重复单元SSR位点中所占的比例呈下降趋势,重复单元均以AT富集的基元为主。2个基因组序列中除三核苷酸重复单元中的优势基序为分别为AAG/CTT(14.24%)和CCG/CGG(21.18%)外,其余重复单元中的优势基序均相同,分别为A/T、AT/AT、AAAT/ATTT、AAAAG/CTTTT、AGATAT/ATATCT(表1和表2)。2个基因组序列中微卫星位点重复单元重复次数分布分别为5~9127次和5~135次,但主要集中在5~15次,各重复单元数量均随重复次数的增加而降低,单核苷酸~六核苷酸单元主要重复次数分别为10、6、5、5、5、5(图1)。对鉴定出的微卫星位点进行引物设计发现,割手密和甘蔗基因组高质量参考序列中分别有472

2.2  割手密、甘蔗和高粱同源基因鉴定

对割手密单倍体35 519个基因的蛋白序列、甘蔗25 316个基因的蛋白序列进行比对,并分别与高粱基因的蛋白进行比对,分别鉴定出16 691个和13 271个对应到高粱1~10号染色体上的同源基因,其中有8854对割手密和甘蔗同源基因同时与高粱基因同源(图2,表3)。甘蔗、割手密和高粱同源基因在各染色体上不均匀分布,其中对应到高粱8号染色体上同源基因最少,推测甘蔗、割手密在进化过程中可能发生了基因丢失事件(图2);其中栽培种甘蔗对应到高粱1~4号染色体上的同源基因最多,且这些基因在甘蔗参考基因组上的分布与其同源基因的分布一致性较高;割手密对应到高粱1、3、4号染色体上的同源基因最多,割手密2、5、6和7号染色体上的同源基因对应到高粱染色体4~9号染色体,可能与高粱向割手密进化过程中染色体的重排和丢失有关;甘蔗-高粱-割手密同时同源的基因也主要对应到高粱1~4号染色体。基因定位显示甘蔗基因组参考序列与高粱基因组的一致性更高(图2),且甘蔗与高粱同源基因大部分具有相同的染色体分布。

2.3  用于遗传图谱遗传来源划分及同源连锁群锚定的标记开发

利用MISA软件对割手密单倍体、栽培种甘蔗与高粱同源基因的全长序列中的SSR位点进行鉴定,其中分别有7887和4766个的基因包含SSR位点(表4),位点个数分别为13 708和8059个,对这些SSR位点进行引物设计,分别获得13 224和7624对SSR引物(表4)。分别以割手密基因组和甘蔗基因组高质量参考序列为模板,对获得的SSR引物进行e-PCR检测,这些引物在割手密基因组中以多位点扩增为主。其中来源于割手密基因组的13 224对SSR引物在2个基因组序列中有效扩增位点比例均为97.88%,但有效标记数差异显著,分别为10 493(79.35%)和4779(36.13%)个(表4)。来源于甘蔗基因组高质量参考序列的7624对SSR引物在2个基因组中的有效扩增位点比例分别为96.81%和99.60%,有效标记数为6024(79.01%)和7118(93.36%)个。

对这些SSR引物在2个基因组的扩增情况进一步分析表明,部分SSR引物表现出特异性扩增。这些特异性SSR位点标记可作为特征标记,用于栽培种甘蔗遗传图谱构建过程中的基因遗传来源划分。源于割手密的SSR引物中共有1368对仅在割手密基因组中单位点扩增,其中有196对可同时在2个基因组中单位点扩增;源于甘蔗的SSR引物中有556对可同时在割手密和甘蔗基因组高质量参考序列中单位点扩增,有1420对仅在甘蔗嵌合单倍体序列中单位点扩增(表5)。这些SSR引物来源于具有单个或多个SSR位点的割手密基因和甘蔗基因,3540个SSR位点来源于2677個单位点基因和363个多位点基因,平均SSR位点密度为1.16(表5)。

对割手密和甘蔗单扩增SSR标记扩增位点在基因组上的分布、标记来源基因对应高粱同源基因在高粱基因组上的分布分析表明:来源于割手密和甘蔗的单基因组扩增标记和双基因组标记扩增位点分布于割手密、甘蔗基因组上并覆盖全部染色体,并且标记来源基因对应的同源高粱基因在也均匀分布于高粱全部染色体上(图3)。割手密和甘蔗SSR扩增位点及同源高粱基因在1~4号染色体上的数量分布具有较高的一致性,占比范围为55%~58%,表明1~4号染色体在进化过程中可能具有较高的稳定性。此外,甘蔗SSR扩增位点和同源高粱基因在染色上的数量分布基本一致,表明甘蔗单倍体基因组与高粱基因组具有较高的一致性(图3)。这些SSR标记扩增位点在基因组上的位置及其同源基因在高粱基因组上的位置,在栽培种甘蔗高密度遗传图谱构建过程中,可作为锚定标记为同源连锁群的划分提供参考。

2.4  割手密和甘蔗单扩增标记在禾本科作物基因组中的特异性

为进一步验证割手密和甘蔗单扩增标记的基因组特异性,在水稻、玉米和高粱基因组中对这些标记进行e-PCR检测,结果表明,割手密单基因组SSR和双基因组SSR中特异性SSR分别占95.24%(1303)和76.53%(150),甘蔗单基因组SSR和双基因组SSR中特异性SSR分别为95.49%(1356)和87.10%(540)。这些单扩增SSR标记在3个禾本科作物基因组中扩增位点数排序为:高粱>玉米>水稻(图4),这可能和割手密、甘蔗与其他禾本科作物的亲缘关系远近有关。其中割手密单扩增SSR标记Sspon8B0134,甘蔗单扩增标记sh030317和sh020847在水稻、玉米和高粱基因组中均能单位点扩增,推测这几个位点可能是禾本科作物进化过程中的保守位点。

x=128)种间的一系列杂交、回交事件[24-25],这导致栽培种甘蔗基因组高度杂合非整倍体,染色体数目在100~150条之间,其中约80%的染色体来源于热带种,10%~15%来源于割手密,5%~10%来自于染色体重组[24-26]。栽培种甘蔗多倍体、非整倍体、种间杂交,同源或部分同源染色体多达10~12条的基因组结构制约着甘蔗遗传图谱的发展。栽培种甘蔗基因组过大,实现对10 Gb基因组的完全覆盖难度大[2],在图谱构建过程中,遗传距离较远的标记很难连锁上图,造成大量的标记浪费;基因组高度同源,不同来源的遗传成分混杂,很难在遗传图谱上得到区分,遗传标记在基因组上的扩增位点过多,读带困难;遗传标记有限且在基因组上分布不均匀,同一染色体上的标记分布在多条连锁群上。

微卫星序列或简单重复序列是重要的通用标记来源,开发的SSR标记具有多态性高,重复性好、共显性遗传等特点,已广泛的应用与甘蔗遗传分析和遗传改良实践。本研究利用割手密基因组中具有1个等位位点基因在染色体上的不均匀分布(割手密基因组18.7%的基因具有1个同源等位基因)及其与高粱基因的同源性,开发了1564个单位点扩增SSR标记,还利用栽培种甘蔗嵌合单体中的基因信息与高粱基因的同源性,开发了1976个甘蔗SSR标记,进一步丰富了甘蔗的分子标记。前人利用不同分子标记对27个甘蔗商业种进行遗传多样性分析显示,与RAPD标记(0.59~

Singh等[30]利用甘蔗EST数据开发的361个SSR标记扩增结果表明,这些EST-SSR等位位点范围为2~15个,平均每个EST-SRR检测7.40个等位位点;Aitken等[9]利用40对AFLP标记对IJ76-514和Q165检测表明,2个品种间的多态性条带范围为13~39。与这些标记相比,本研究开发的SSR标记扩增位点较少、特异性更高,并且定位于特定染色体上,这些标记的使用降低了带型统计的难度,有助于进一步认识甘蔗基因组中来源于割手密部分的遗传结构。

此外,本研究开发的标记中有1420个SSR标记为甘蔗特异性标记,在割手密基因组中无扩增位点,推测这部分标记可能是甘蔗基因组中来源于热带原种的部分。来源于甘蔗和割手密SSR标记在2个基因中的扩增情况,可用于区分栽培种甘蔗遗传图谱构建过程中的基因遗传来源。且甘蔗SSR标记在甘蔗嵌合单倍体中的位置,及同源高粱基因在高粱基因组中的位置,为栽培种甘蔗遗传图谱构建中同源连锁群的区分提供了重要的参考信息。

[2] 苏俊波. 新形势下我国甘蔗产业竞争力研究[D]. 福州: 福建农林大学, 2016.

我要回帖

更多关于 引物blast结果分析 的文章

 

随机推荐