科研人员完成了新版的树鼩基因组高精度测序、组装和注释

2019-08-22 12:01:12
来源: 中国新闻网

  【摘要】 科研人员完成了新版的树鼩基因组高精度测序、组装和注释

科研人员完成新版树鼩基因组测序填补首版约73%拼装缺口

图为最新版树鼩基因组与数据库。 中国科学院昆明动物研究所供图 摄

记者21日从中国科学院昆明动物研究所获悉,近期,该所科研人员完成了新版的树鼩基因组高精度测序、组装和注释。新版树鼩基因组填补了第一版基因组中约73%的拼装缺口。

据介绍,树鼩是一种与实验大鼠差不多大小的小型哺乳动物,为灵长类动物的近亲,在生物医学研究中颇具潜力。目前,树鼩已被用于感染性疾病如乙型肝炎、丙型肝炎、疱疹病毒感染、禽流感病毒感染等模型创建,在视觉系统研究、近视模型,以及一些肿瘤模型构建方面,显示了很好的前景。

2013年,为了解决树鼩用于疾病动物模型创建时缺少基因组学等遗传信息的问题,中国科学院昆明动物研究所姚永刚课题组牵头组织中科院动物模型与人类疾病机理重点实验室相关研究团队,联合华大基因,发表了利用二代测序技术测定的中缅树鼩的全基因组,较为全面地获取了树鼩的遗传特性,证实树鼩与灵长类动物的亲缘关系最近。基于此版树鼩基因组数据,姚永刚课题组建立了首个树鼩基因组数据库,实现了树鼩基因组数据的自由访问和共享。但由于二代测序读长过短等技术局限,第一版树鼩基因组中存在一些问题。

近期,来自姚永刚课题组的博士范宇利用单分子实时测序技术,结合高通量染色质构象捕获技术测序数据,完成了新版的树鼩基因组高精度测序、组装和注释。这一版树鼩基因组填补了第一版基因组中约73%的拼装缺口(163,220个),其中处于基因编码区的缺口全部得到填补。此外,新版树鼩基因组中,蛋白编码基因的数量与序列长度较第一版基因组有明显的质量提升,基因结构的精确度也明显上升。

基于第二版基因组信息,范宇等人完成了基因组重复序列的分析,发现120多个长转座子和400多万个包含短重复序列(长度小于150bp)和长重复序列(长度大于5kb)的卫星区域。对LINE1的分析发现,树鼩基因组中的LINE1占基因组的18.54%,这种基因组占比和人类的类似。与包括人类、猕猴和小鼠的基因组结构变异对比分析后发现,相比较于人类,树鼩基因组中含有221个结构变异,猕猴基因组中有188个结构变异,而小鼠基因组中的结构变异多达387个。有趣的是,一些结构变异,如位于MYSM1基因和SLC35D1基因间的区域,只出现在树鼩和灵长类动物中,这一结果也从结构变异的角度说明,相比于小鼠,树鼩与灵长类动物在基因组方面有更高的相似性。

据悉,为了更好地展示最新版的树鼩基因组信息,课题组将新版基因组数据、注释信息、群体遗传学参数、预测的基因共表达网络等数据,增加或更新在第二版树鼩基因组数据库中。这些用户友好型的数据库构建与更新,将为树鼩动物模型的研究提供相关基础数据,有望继续惠及树鼩研究领域。

上述研究工作以“Chromosomal level assembly and population sequencing of the Chinese tree shrew genome”为题,发表在动物学领域SCI期刊《Zoological Research》上。该研究工作得到国家自然科学基金委、中国科学院和云南省的资助。(完)

(记者 胡远航)