G2P-SOL项目是一个欧盟资助的茄科作物项目,汇集了欧洲和国际上主要的种质库,其中包括马铃薯、番茄、胡椒和茄子这四种主要茄科作物的种质资源。在该项目中,已对包括野生近缘种在内的约 5,900 个茄子种质进行了收集。 为了获得约 3,500 个代表性种质的基因组信息,该项目设计了一组定制的 5K SNP位点的SPET 技术探针(单引物富集技术,Nugen),这些SNP位点均匀分布在整个基因组,并且SNP位点主要位于基因丰富的区域。 DNA 样本由基因库提供,而文库制备和 illumina 高通量基因测序由 IGA Technology 公司提供服务。测序数据经质量过滤后,使用 BWA-MEM 将reads与茄子参考基因组序列(4.1 版)比对,并使用 GATK-4.1.9软件进行 SNP 分析。通过删除具有低覆盖测序数据的种质,保留了 3,412 个,并通过应用严格的质量标准确定了 120K 多态位点。其中,4306个多态位点为5K SPET探针组靶向的SNP,其余为辅助脱靶SNP。 这些确认的SNP位点为为识别错误标记的种质(即错误的物种识别)和基因库内及不同基因库之间的重复的物种记录提供了重要信息。此外,SPET技术可用于建立筛选实验流程以避免不同地域进行重复的种质资源保护。 研究茄子种质间的种群结构和遗传关系可为全基因组关联分析(Genome wide association study,GWAS)建立核心种质库。此外,基于基因库中可用的历史表型数据,可确定与关键性状相关的位点。 实验结果表明,SPET 技术可作为简化基因组测序和基因芯片的替代方法,是一种可适用于高通量基因分型、管理和增强基因库收藏的有效工具。
SPET 技术背景介绍:
单核苷酸多态性 (SNP) 是真核生物基因组中丰富的序列变异类型,并且已成为广泛使用的基因分型标记。 基因分型方法依赖于不同的技术,包括高通量测序NGS、基因芯片和聚合酶链式反应 (PCR)。目前,常用的高通量 SNP 发现和基因分型方法是基于简化基因组测序 (RRS)手段的高通量基因分型测序(GBS,Genotyping by Sequencing)方法,其中大多数是基于限制性内切酶的使用来片段化基因组,通过对这些酶切DNA序列来测序来替代全基因组测序,从而达到基因分型目的。 GBS技术的一个主要限制是限制酶位点并不是在基因组上随机分布的,因此无法在基因内靶向定位或定位在具有功能意义的分子标记。
Nugen公司(现Tecan Genomics公司)开发了单引物富集技术,这是一种可定制的靶向测序的解决方案,且经济实惠。 SPET技术通过已有的参考基因组或转录组信息以及需要验证的靶向SNP组来进行探针设计。 SPET 探针长约 40bp,探针设计为与包含SNP的相邻DNA序列,因此能够检测目标SNP并发现目标周围其他的SNP。SPET最初是应用于医学领域,多篇Nature文献都有报道。由于单引物富集相对于PCR引物设计具有更高的灵活性,2019年Scaglione等人在欧盟的项目中把该技术应用在植物分子育种的研究中,评估了SPET技术对玉米和黑杨的基因分型应用。SPET同样可应用于种质集的基因分型。外显子的保守序列应有助于在这些区域上设计的 SPET 探针来研究不同相关物种之间的杂交,从而提高发现新 SNP 的机会,特别是如果探针下游区域位于保守性较低的区域,如内含子和非翻译区域 UTR。