国际首个动植物基因组变异-表型关联知识库 (GWAS Atlas) 正式上线发表

近日,“生物多样性与生态安全”项目“生物多样性组学数据平台和数据库系统”研究人员开发的国际上首个动植物基因组变异-表型关联知识库(GWAS Atlas)正式上线发表,该项研究成果以GWAS Atlas: a curated resource of genome-wide variant-trait associations in plants and animals为题在国际学术期刊《核酸研究》(Nucleic Acids Research)在线发表。

全基因组关联分析(GWAS),即指在全基因组范围内找出存在的序列变异,从中筛选出与疾病、表型性状等相关联的遗传位点,是挖掘生物复杂性状遗传基础的关键技术。随着高通量测序技术的快速发展,多个物种产生了越来越多的高质量基因型数据,并已解析了与许多动植物复杂性状相关联的遗传位点。但这些知识信息都分散在不同文献中,不利于知识整合、挖掘与再利用。为此国家基因组科学数据中心的科研人员通过关键词检索、人工审编、词条比对注释等技术手段,结构化整理了现有主要农作物和畜牧动物的基因型-表型关联知识,开发了世界上首个动植物基因组变异-表型关联知识库GWAS Atlas。

GWAS Atlas知识库整合了9个物种(包括棉花、梅花、玉米、油菜籽、水稻、高粱、大豆7种植物和山羊、猪两种动物)与614个性状关联的75467条基因型-表型(G2P)信息,并通过语义比对等映射到五个不同的性状本体上(植物性状本体PTO,家畜性状本体ATOL,作物本体CO等),方便用户通过基于本体的层级结构来查找感兴趣的性状及对应的G2P关联信息。此外,研究人员还分析并定义了与多个性状相关联的多效基因及遗传位点,支持用户通过不同模块在线浏览、检索与下载。

GWAS Atlas作为首个综合多物种的变异-性状关联知识库,是全基因组变异信息数据库(GVM)的延伸,将为未来重要农艺性状的模块化遗传研究和育种应用提供重要资源和平台。

A.jpg

GWAS Atlas 资源信息统计

Copyright © 2018 京ICP备05080539号-26 京公网安备11010802032011号 中国科学院地球大数据科学工程
地址:北京市海淀区邓庄南路9号 100094 Email:casearth@radi.ac.cn