精神病学中的多基因风险评分它们对临床医生

导读

主要的精神疾病是可以遗传的,但它们在遗传上很复杂。这表明,除了某些特例外,单基因标记对诊断是没有帮助的。然而,我们对大量的基因变异有更多的了解,即这些变异组合在一起,会导致精神分裂症、双相情感障碍和其他精神疾病。这些风险变异的存在现在可以合并成一个多基因风险评分(PRS)。这种提供了个体风险变异的基因组负担的定量指标,它与一个人患有特定疾病的可能性相关。目前,这样的评分在研究中非常有用,可以告诉我们很多有关不同疾病和其他脑功能指标之间的关系。未来,随着支持此类评分发展的数据集变得更大、更多样化,以及方法学的发展提高了预测能力,我们预计PRS将在评估疾病风险、疾病亚型甚至治疗反应方面具有重要的临床应用价值。本文讨论了PRS在精神病学中的应用、局限性和注意事项,以及它的现在和未来。

1.首先先来了解一下与PRS有关的术语:

单基因:

单基因疾病是由单个基因的突变引起的,它与疾病有一对一的对应关系,并且被认为是致病的。突变可能存在于一个或两个染色体上(其中一个染色体是从每个亲本遗传而来的)。

寡基因:

寡基因遗传是单基因遗传(其中一个性状由一个单一致病基因决定)和多基因遗传(其中一个性状受许多基因以及环境因素影响)之间的中介。它描述了一种情况,即少数基因决定性状,使用孟德尔模型检测不到连锁,表型-基因型相关性可以通过包含来自另一个基因座(或位点)的基因型来改善。

多基因疾病:

多基因疾病是指其表型受多种基因影响的疾病。因此,多基因疾病不像单基因疾病那样简单地遗传,在单基因疾病中,疾病基因的遗传和疾病的表现之间存在一对一的比率。身高或肤色等性状是多基因性状的例子,通常表现为连续分布。

多基因风险评分:

遗传变异的基因组负担的数字量度,其基于多个遗传基因座的变异及其相关效应大小,增加了疾病风险或定量性状变异的风险。

异质性:

遗传异质性可以定义为在两个或多个基因座上产生相同或相似表型的突变或风险变异。异质性疾病是一种可以由两个或多个基因座的突变引起但具有相同临床表现的疾病。在多基因疾病的背景下,不同基因中不同变体的组合可能导致相同或相似的临床表现。

多效性:

当一个基因(或遗传变异)影响两个或更多看似不相关的表型性状时,该基因被描述为多效性。

基因组变异:

基因组变异描述了我们基因组之间的差异,这可能会也可能不会对我们的健康产生影响。这些基因大小不同,可能影响基因蛋白质编码序列中的DNA序列,可能位于内含子(即在成熟RNA形成之前通过RNA剪接去除的基因中的核苷酸序列,并可转录成蛋白质)或基因间区域(即基因之间的核苷酸序列)。一个基因组包含数以百万计的遗传变异,这使得每个人都是独一无二的。

单核苷酸多态性(SNP)或单核苷酸变异:

一种非常常见的遗传变异类型,代表DNA序列中单核苷酸构建模块的差异,可能对基因功能或任何性状有影响,也可能没有影响。在一个群体中,每个SNP变异都在一定程度上存在(例如,1%)。

风险等位基因(或风险变异):

风险等位基因被定义为一种基因变异,这种基因变异在病例中比在对照组中更常见,但并不仅限于在两组中观察到。这与突变形成对比,突变与疾病有一对一的关系,被描述为致病。

独立风险等位基因(或风险变异):

由于随机分类和重组而独立于人群中其他风险变异而遗传的风险变异.独立风险等位基因的识别需要一个被称为“剪枝”的过程,在这个过程中,染色体上彼此接近的变异体经常被传递在一起,因此被认为处于“连锁不平衡”,直到剩余的变异体在统计上有效地独立.

因果变异:

因果变异具有直接的生物学效应和对表型的直接影响。因果变异对位点上的关联信号负责,尽管这种关联可以通过使用与因果变异连锁不平衡的其他非因果变异来识别。

效应大小:

对遗传关联程度的定量测量,由它对性状总遗传变异的贡献以及在关联研究中检测它的统计能力决定。效应大小还受到基因与环境相互作用的影响,当特定的环境暴露更为常见时,这可能会导致特定群体的变异性,从而增加遗传关联的表观强度。对于大多数以零为中心的效果大小类型(例如,β系数),绝对值越大,效果越强;主要的例外是如果效果大小是一个优势比。

附加效应:

描述两个或多个独立变量对结果的联合效应等于它们各自效应之和的情况。这与协同(或上位)交互作用形成对比,在协同(或上位)交互作用中,两个或多个独立变量对结果的综合影响大于它们各自影响的总和。

拷贝数变异(CNV):

是一种基因组片段被删除、重复或颠倒的现象,基因组中的重复数目因群体中的个体而异。CNVs可以包含影响基因表达的完整基因或关键调控元件,或者可能没有明显的功能作用。

致病变异:

增加个体对某种特征、疾病或紊乱的易感性或易感性的基因改变。当这种变异(或突变)被遗传时,症状的发展更有可能,但不确定。

内表型:

也称为中间表型,这一遗传流行病学术语用于将行为症状分离成更稳定的表型,这可能反映了具有明确遗传联系的更基本的过程。在反映离散生物系统的功能方面可靠且可合理遗传的定量生物学特征可能比广泛的临床表型或复杂的精神病学现象(通常通过超过症状阈值来定义)更密切地与疾病的根本原因相关。

表观遗传:

与不涉及DNA核苷酸序列改变的基因表达(或可遗传表型)的非遗传影响有关的,或由这种影响引起的。这种变化可以包括DNA序列的化学修饰或染色质结构的变化,这些变化改变了DNA对基因表达中所涉及的蛋白质的可及性,从而为响应环境开启或关闭表达提供了一种机制。

异型连续性:

由另一种疾病或疾病预测的疾病,其中疾病A是疾病B的病因,患有疾病B的人通常首先患有疾病A,或者疾病A和疾病B具有共同的易感性因素。

2.背景介绍

多基因风险的概念最初是在经典遗传学中提出的,并且从20世纪初就开始讨论和建模。随着全基因组关联研究(GWAS)的出现,对人类复杂性状的多基因风险进行了精确量化。年,国际精神分裂症联盟首次将多基因风险评分(PRS)应用于精神病学,自此彻底改变了精神病学基因组学研究。虽然,目前还不清楚PRS是如何产生的,它们的局限性和适用性是什么,以及现在和将来如何更好地使用PRS。这一综述的重点是指导精神病学从业者和受训者,在今天和未来几十年里,在精神病学中使用PRS。

3.通过精神病学基因组学加速知识

精神病学的早期基因组研究假设可能有一个或几个主要影响基因或基因座(即精神疾病是单基因或寡基因的),并且这些关键风险基因的鉴定将为疾病机制提供清晰的见解。多年的研究未能使用这些简单的遗传模型找到一致的信号,该领域开始理解大多数常见的精神疾病都是多基因和遗传异质性的(也就是说,有几十个或几百个基因位点影响疾病风险,不同人群的风险等位基因组合也不同)。这是研究人员思维的一个转变;随之而来的是,人们认识到,单个研究者或群体能够收集的样本量不足以提供足够的能力来清楚地检测基因效应,其中大部分单独来说都是非常小的(尽管结合起来相当大)。

新的和更有效的分子技术降低了全基因组基因分型的成本,大规模的合作方法——如精神病基因组学联合会开展的方法——现在正结出果实。在过去十年中,这些大规模的协作基因组研究将我们对许多精神疾病的分子结构的了解提高到了前所未有的程度。这些研究还使我们能够深入了解疾病间遗传效应的多效性,这些疾病在临床上是根据症状学的模式进行区分的,但往往具有共同的临床特征。

4.多基因风险评分概述

在过去的10年里,计算PRS的方法已经发展成为一种工具,将许多基因位点的累积效应捕捉到一个单一的定量指标中。这一定量评分对独立GWAS的单核苷酸多态性(snps)的影响进行了汇总,列举了该个体在每个位点(0、1或2)携带了多少风险等位基因,并根据其影响大小对每个位点的风险等位基因进行了加权。

风险等位基因被定义为在病例中比对照更常见的基因变体(或与数量性状的更严重表现相关的基因变异)。效应大小通常被估计为数量性状的β系数和分类二元性状的比值比(比值比到中心值的对数变换在PRS中使用,因此PRS可以被计算为加权基因型的总和)。

图1举例说明了PRS的总体分布。PRS可以使用不同组的疾病相关变异来计算,并且通常使用不同的疾病相关p值阈值来为特定的疾病或特征创建一系列PRS。在病例对照组之间观察到最佳区别的p值阈值被选择为最佳。

直觉告诉我们,只有在全基因组显著性上紧密相关的变异才包含真正的疾病风险预测因子,而没有“噪音”;然而,这些预测因子通常解释疾病风险的微小变化,因此预测的准确性很低。因此,通常的做法是通过使用基因组中许多独立的风险等位基因来进行遗传预测——包括数十万个SNP变异体,其中大多数变异体本身仅显示出疾病关联的微弱证据——假设许多真正的重要关联由于原始GWAS中的能力不足而可能被遗漏。这种方法对许多精神疾病产生了更强的预测能力,最大限度地提高了病例和对照之间区分的预测能力和准确性(根据曲线下的预测区域或AUCs测量),精神分裂症为82%,双相情感障碍为68%,重性抑郁障碍为58%,焦虑为54%(相比之下,AUC为50%,描述的是一个预测不优于机会的测试),随着更强大和多样化的发现GWAS和量化多基因风险的改进方法,这些鉴别估计将可能会得到改善。理想情况下,为了有用,预测能力需要至少适度(即超过70%至80%),但最好是高度(即超过90%)预测。

最近,已经计算并应用了反映基于生物学过程(例如,信号通路成员、蛋白质-蛋白质相互作用或药物治疗反应)的SNP组选择的PRS。与反映总体疾病风险的风险评分相比,这些途径特异性PRS可以更可靠地预测表型变异,并且可能更易于绘制疾病的特定内表型或表型相关基因。

图1多基因风险评分(PRS)群体分布的一个例子。黑线代表在普通人群(上)和受疾病影响的个体病例人群(下)中复杂遗传疾病的prs分布。在人群水平上,病例组的平均prs高于对照组的平均prs,尽管许多病例的分数低于一般人群的平均分数。红线表示具有“高prs”的单个个体,该个体的得分位于普通人群的前94%和病例人群的前90%。

5.多基因风险评分的局限性和注意事项

为了在精神病学实践中有效地使用PRS,理解这种方法的局限性和解释PRS的考虑因素是至关重要的。

首先,PRS对种族背景高度敏感——这意味着PRS的变异性可能受到等位基因频率差异、估计效应大小差异以及不同种族群体间人口结构差异的严重影响。例如,如果一种疾病相关的风险变异在一个人群中很常见,但在另一个人群中频率较低(例如,X族群的一般人群中“A”等位基因频率为20%,而Y族群为5%),那么X族群的个体偶然携带一个或多个风险等位基因的可能性比Y族群的个体高得多(即36%对10%,基于Hardy-Weinberg均衡的原则,其中f(AA+Aa)=p2+2pq)。

此外,由于人口历史的差异(包括有效人口规模和独特的移民和近亲繁殖率),基因组变异的遗传模式在一些种族群体中比在其他种族群体中更易变和复杂(例如,与欧洲血统的人相比,非洲血统的人往往具有更短的单体型区块)。更复杂的遗传模式需要更多数量的基因变异包含在PRS中,并且因为PRS中包含的SNP本身通常不是因果性的,因果性变异可能被不同人群中的不同SNP“标记”,导致不同的检测效果大小和不同组的最大信息量SNP。

效应大小还受到基因与环境相互作用的影响,这可能导致特定群体的变异性。将种族的数量遗传特征作为协变量纳入关联测试将在一定程度上调整主要GWAS中的这些种族特异性效应,但是将这些数据应用于不同种族的独立样本以发现样本尤其容易出错,并充满了潜在的误解。由于这个原因(以及许多其他原因),未来的GWAS必须包括对来自不同种族背景的受试者的分析,以提高这些结果对所有人群的普遍性和实用性,而不是采用最近的以欧洲为中心的方法,并且正在努力解决这个关键问题。

其次,PRS的准确性取决于用于确定疾病相关变异和风险等位基因的发现样本的信息度。样本量较大的研究产生了更大的能力来检测小的遗传效应,并提供SNP效应大小的更准确的估计。

今天,适当的样本量通常包括数万个病例和类似或更多数量的对照。随着时间的推移,样本量和功率预计会增加。然而,大样本确实在临床和遗传水平上固有地增加了异质性,并且有可能使遗传关联信号不那么清楚。大型合作研究的样本通常在多个研究地点和多个国家确定,在这些国家,诊断实践和人口统计学/流行病学风险因素的暴露可能略有不同,这可能会引入人工关联,并导致不同队列之间关联强度和影响大小估计值的波动。

总的来说,基于来自精神病学基因组学联合会的样本的PRS(其摘要统计数据可公开获得)已经过可靠的审查和处理(但目前主要基于高加索欧洲血统的个体,其含义如上所述)。

此外,通过使用来自第二相关性状或疾病的GWAS的信息,有可能在已经确定具有特定性状或疾病的人群中计算PRS。一个例子是使用酒精消耗量GWAS汇总统计(即检查每周酒精消耗量),以描述酒精使用障碍的风险,这是相关的结构,但没有直接联系。如果这两个特征的遗传原因重叠,并且PRS的预测性能良好,那么也将观察到与相关PRS的显著关联;然而,在相关性状中提供病例组和对照组之间最大区别的SNP可能不同于最大区别主要性状的SNP。因此,在对特定分析或特征的PRS的准确性(或缺乏准确性)做出判断之前,识别和理解作为产生PRS基础的主要GWAS是很重要的。在上面的例子中,酒精消费与酒精使用障碍的风险只有部分基因重叠,因此预测的准确性是有限的。

最后,由于GWAS通常


转载请注明:http://www.bwoaa.com/hbwh/12526.html

当前时间: