皓歌云-专业的科研采购信息和实验资讯平台
首页 > 文章资讯 > PsyMuKB:神经精神疾病知识库助力遗传探索和临床发现
PsyMuKB:神经精神疾病知识库助力遗传探索和临床发现
2021/1/26 16:50:21




背景



新发变异(DNVs)是指在继承父母双方基因组一半的过程中,在配子发生期间和受精卵形成时发生的新的罕见遗传变异(图1)。近年来,随着高通量技术的发展,通过全外显子测序(WES)和全基因组测序(WGS)已经鉴定出了大量的DNVs。很多相关的研究也已证明罕见DNVs具有高疾病风险性,与多种人类复杂疾病的起因有关,特别是神经精神发育疾病。为了进一步评估DNVs对复杂疾病的影响,对DNVs进行注释和分析的研究工作近年来成为疾病病因和病理研究的热点。因目前对神经精神疾病的新发罕见DNA变异的注释大多还停留在基因层面,以致于对变异如何导致疾病发生的理解还是非常有限,比如为何携带新发罕见的DNA变异,有的人发病,有的人却症状轻微或不发病?为了帮助广大科研和临床研究者回答这些问题,同时能更精准地锚定高风险变异和所影响区域,我们急需搭建一个不同于已有数据库的、多层次、多角度的新发罕见变异检索、浏览和分析平台。


微信图片_20210126161529.jpg

图1 新发突变的图解




目前很少有研究从不同的可变剪切(alternative spliced)的转录本层面对罕见变异进行定位和解释,但大量的基因都存在不同层度的可变剪切,特别在人脑中可发生在多达95%的基因上,是人类转录组和蛋白质组学多样性组成的重要原因。基于可变剪切的特性,外显子可被同一基因的不同转录本选择性使用,因此罕见突变可能只影响到在一个基因里那些能携带突变外显子的转录本,而非一个基因内的所有转录本。同时,转录本具有高度的脑组织或神经细胞、以及脑发育时期的表达特异性。更重要的是,这些可变剪切的表达方式在脑组织中以高频发生,并参与调节神经发育过程中的生物学过程,如神经元迁移、轴突引导和突触形成等重要代谢功能。因此,将组织特异性转录本与疾病突变的发生位置相关联是提高科研人员对人类复杂疾病认识的一个非常必要的步骤。
本文报道了上海交通大学林关宁教授研究团队和东北师范大学王晗教授研究团队联合发布的神经精神疾病突变知识库PsyMuKB,该知识库包含了多方位多层次注释的转录和翻译的新发突变集合,提供了功能齐全的可视化界面,能够识别有组织特异性转录本的新发突变。

结果与总结
我们基于公开报道的文献收集到大量DNVs,通过细致人工校正整理、注释以及整合,构建了一个多维多元的神经精神疾病突变知识库PsyMuKB(图2)。当前版本(PsyMuKB.v.1.5)涵盖了~87万个新发变异,涉及~24种不同神经精神以及发育相关疾病(包括孤独症谱系障碍、双相情感障碍、发育迟缓、智力障碍、强迫症、精神分裂症等),同时整合了大规模的基因组和蛋白质组数据,包括大脑发育表达、神经元单细胞转录组、调控元件和转录注释、蛋白相互作用和蛋白质亚型表达等多维度遗传数据。


微信图片_20210126161537.jpg

图2 PsyMuKB数据组织架构图




为了更加直观地反映PsyMuKB中大规模DNVs在不同神经精神疾病临床表型和功能类别的分布,我们进行了信息统计(图3)。其中共有876,175个是新发突变[DNMs,包括单核苷酸变异(SNV)和插入缺失型突变(indel)],影响了整个基因组的732,879个位点,其中大约61.5%来自对照组(各种神经精神发育疾病队列研究、患者健康兄弟姐妹以及胎儿样本)。同时,这些DNMs绝大多数都位于基因组的非编码区域,仅有约4.3%落在外显子上。此外,PsyMuKB从已报道的基因组规模研究中筛选了841个新发拷贝数变异(CNVs),涵盖了8种不同的临床表型,影响了369个非重叠基因组区域,范围从1 kb至600 Mb。



微信图片_20210126161543.jpg

图3 PsyMuKB目前版本包含的新发变异情况分布图




PsyMuKB的主要功能则是提供了以基因为中心的全方面神经发育相关突变信息的有机整合分布。图4以神经精神病相关基因DYRK1A为示例,来展示PsyMuKB的基本使用。在PsyMuKB的网站上检索DYRK1A,就会得到该基因相关的所有信息包括别称、介绍、致病性评估等基因基本信息(图4A),表达、调控元件、蛋白质相互作用网络等基因注释信息(图4B),突变分布、不同转录物中突变基因组位置可视化等突变统计信息(图4C),以及使用转录本的组织特异性表达及其外显子-内含子结构图鉴定基因的转录本特异性突变的界面(图4D)。



微信图片_20210126161549.jpg

图4 DYRK1A基因及突变信息分布




另外,PsyMuKB的一个特色功能就是可以通过可变剪接转录本层面探索新发突变对精神疾病的影响(图5)。通过对PsyMuKB中的所有DNMs在三种不同类型(最长转录本、脑表达转录本、非脑表达转录本)外显子区域的重叠度和百分比分析,显示了神经精神疾病的DNM大部分还是位于最长的、且脑区表达的mRNA亚型中。但我们同时分析了DNM所在的相应三种不同类型蛋白质isoform(最长转录本、脑表达转录本、非脑表达转录本)的外显子区域的重叠度和百分比,发现分布比例和mRNA转录本的结果存在明显的差异。PsyMuKB基于以上的初步分析后,为进一步探索单个突变在不同mRNA转录本和蛋白质亚型的分布进行了细化。如图5C所示,用户可使用在CHD8基因chr14:21899618发生“G > C” 的stop-gain DNM变异,去探索mRNA转录本和蛋白质isoform特异性分布情况,包括受该无义突变的转录本及蛋白亚型,有无脑表达和转录本组织特异性表达分布等情况。



微信图片_20210126161555.jpg

图5 PsyMuKB在可变剪接转录本层面探索新发突变




总之,PsyMuKB是一个全面且用户友好的神经精神疾病变异数据知识库,采用了模块化方式构建信息知识平台,采用高性能非SQL数据库管理系统管理/整合/处理/访问的多维数据,能快速准确地更新、搜索、注释及展示突变信息。同时,PsyMuKB提供数据库中全部数据的下载功能,详细使用说明可访问http://psymukb.net/Document/UserGuide。
此项研究工作获得了上海市精神卫生中心临床研究团队的大力支持。相关经费主要由国家重点研发计划“精神分裂症和双相障碍多模态精准诊疗方案优化研究”(2017YFC0909200)基金提供支持。值得期待的是,PsyMuKB将会不断更新升级,致力于打造成为神经精神疾病临床科研首选的遗传类知识库。在后续的更新中,我们将会:1)不断优化更新,并整合对用户更有帮助的组学数据,我们计划近期在下个版本中加入翻译后修饰(PTM)位点信息等;2)尝试设计API或应用程序来与NGS管道、权威数据库等平台对接,更好地及时更新数据库信息。
我们希望PsyMuKB能为那些致力于研究人类疾病遗传变异的研究团体提供宝贵的资源。还有更多关于PsyMuKB的内容,欢迎大家使用,解锁新技能。同时,如果有任何问题,评论和建议,欢迎联系我们。PsyMuKB目前的访问地址为:http://psymukb.net/。






文章编译来源:Guan Ning Lin, Sijia Guo, Xian Tan, Weidi Wang, Wei Qian, Weichen Song, et al. PsyMuKB: An Integrative De Novo Variant Knowledge Base for Developmental Disorders. Genomics Proteomics Bioinformatics 2019,17(4):453-464. 引用请参考以上格式,英文全文详见https://www.sciencedirect.com/science/article/pii/S1672022920300218。