科研动态
中国中医科学院中药资源中心联合构建迄今为止物种数量最多的叶绿体基因组综合数据库
近日,中国中医科学院中药资源中心分子生药学创新团队联合中科院北京基因组研究所(国家基因组科学数据中心)系统地进行了叶绿体基因组数据人工审编与分子标记开发,构建了叶绿体基因组综合数据库Chloroplast Genome Information Resource (CGIR, https://ngdc.cncb.ac.cn/cgir)。该数据库收录了来自11,946个物种的19,388条叶绿体基因组,数据整合了已发布的叶绿体基因组数据和利用全国第四次中药资源普查标本自测的718种未发表的叶绿体基因组,是迄今为止物种数量最多的叶绿体基因组数据库。为便于数据的共享应用,CGIR数据库包含了基因组(Genomes)、基因(Genes)、微卫星序列(SSRs)、DNA条形码(Barcodes), DNA特征序列(DSSs)五个模块。相关成果以Towards comprehensive integration and curation of chloroplast genomes为题发表于Plant Biotechnology Journal杂志上。
根据生物物种名录(The Catalogue of Life),CGIR首先对所收录叶绿体基因组的物种分类信息进行了审编,并依据权威植物研究机构邱园发布的世界功能植物名录(World Checklist of Useful Plant Species)对药用植物、食用植物、环境植物、能源植物、有毒植物、能源植物等进行了标注。同时,CGIR对基因名的不规范命名、异名、错误注释等情况也进行了审编。在此基础上,CGIR提供了按照纲、目、科、属、种不同分类层级浏览、下载相关数据的方法,极大地便利了用户使用。
针对分子标记开发这一叶绿体基因组最为常见的应用情景,CGIR使用生物信息学方法计算了所收录叶绿体基因组的微卫星序列、DNA条形码和DNA特征序列三种不同类型分子标记信息,以及用于silico PCR的引物,且同时开发了相应的树型视图方便用户根据分类层级信息快速寻找目标标记,简化了研究人员开发分子标记的流程。
综上,CGIR通过自主测序、整合公开基因组资源和人工数据审编向用户提供了目前为止最全面、物种数量最多的叶绿体基因组数据。经审编的物种分类、物种功能、基因名称与序列、分子标记等保证了数据的高度可靠,对植物系统发育、物种鉴定、叶绿体基因工程的发展均具有重要意义。未来,CGIR还将定期更新补充数据、不断扩展新的模块以持续推动叶绿体基因组的研究。
黄璐琦院士、袁媛研究员、章张研究员为共同通讯作者,华中一博士研究生、田冬梅工程师、蒋超副研究员、宋述慧研究员为共同第一作者。研究得到了科技基础资源调查专项、中国中医科学院科技创新工程项目、中央本级重大增减支项目“名贵中药资源可持续利用能力建设项目”的资助。