所有人类在其基因组的估计有 60 亿个字母代码中都有几乎相同的 DNA 序列。个体之间存在细微的差异,使我们每个人都是独一无二的。 这些差异,称为基因组变异,发生在 DNA 内的特定位置。DNA 像代码一样被读取。 该代码由四种类型的化学构件组成 – 腺嘌呤、胸腺嘧啶、胞嘧啶和鸟嘌呤,缩写为字母 A、T、C 和 G。基因组变异发生在 DNA 中代码因人而异的位置。例如,在下面的第一个人中,该位置显示一个“C”基地。 但在第二个人的同一位置,它是一个“T”。
一个人的基因组中大约有 4 到 5 百万个这样的基因组变异。 这些变体可能是该个体独有的,也可能发生在其他人身上。一些变种会增加患疾病的风险,而另一些可能会降低这种风险; 其他对疾病风险没有影响。问题是:这些基因组变异如何影响特定疾病的风险?
图片中 显示了由字母“V”表示的基因组变异。 有些是在个人之间共享的,而另一些是特定于一个人的。
研究人员通常将遗传疾病分为两类:与单个基因相关的疾病和受多个基因和环境因素影响的疾病。 许多疾病介于这两个极端之间。
单基因疾病
许多遗传性疾病可以追溯到单个基因的变异。 囊性纤维化是一种进行性遗传疾病,会导致长期肺部感染并随着时间的推移限制呼吸能力,是由 7 号染色体上的囊性纤维化跨膜电导调节器 (CFTR) 基因的变异引起的。
每个小“v”代表个体基因组中存在但与囊性纤维化无关的基因组变异。 每个较大的“V”代表一个 CFTR 基因突变。
复杂疾病
复杂疾病的发生是由于许多基因组变异,再加上环境影响(如饮食、睡眠、压力和吸烟)。 它们也被称为“多基因”疾病——“多”表示许多,“基因”表示涉及基因。
每个红色“v”代表个体基因组中与冠状动脉疾病相关的变异。 每个较小的灰色“v”是一个变体,也存在于人的基因组中,但与疾病无关。
冠状动脉疾病是一种复杂的疾病。 研究人员发现了大约 60 种基因组变异,这些变异在冠状动脉疾病患者中更为常见。 这些变体中的大多数分散在基因组中,不会聚集在一个特定的染色体上。
计算多基因风险评分
研究人员通过比较患有和不患有这些疾病的个体的基因组来识别与复杂疾病相关的基因组变异。现在可用的大量基因组数据使研究人员能够计算出在患有特定疾病的人群中更容易发现哪些变异。 每种疾病可能有数百甚至数千种变异。研究人员将这些信息输入计算机并使用统计数据来估计一个人的变异集合如何影响他们患某种疾病的风险。这会产生多基因风险评分。所有这些都可以在不知道复杂疾病中涉及的特定基因的情况下完成。 虽然有一天我们可能会知道所有涉及的基因,但研究人员现在可以在没有这种联系的情况下估计风险。
如何解释多基因风险评分
多基因风险评分只能解释疾病的相对风险。为什么是相对的?用于生成多基因风险评分的数据来自大规模基因组研究。这些研究通过将患有某种疾病的群体与没有疾病的群体进行比较来发现基因组变异。
多基因风险评分告诉您一个人的风险与其他基因构成不同的人相比如何。然而,多基因评分并不能提供疾病进展的基线或时间框架。例如,考虑两个患有冠心病的多基因风险评分高的人。第一人22岁,后者98岁。虽然多基因风险评分相同,但终生患病风险不同。多基因风险评分仅显示相关性,而非因果关系。
绝对风险不同。绝对风险表明疾病发生的可能性。携带 BRCA1 突变的女性患乳腺癌的绝对风险为 60-80%。即使没有与任何人群进行任何比较,这也是正确的。
每个多基因风险评分都可以放在钟形曲线分布上。 大多数人会发现他们的分数处于中间,这表明患疾病的平均风险。 其他人可能会发现自己处于尾端,将他们置于低风险或高风险之中。 在频谱的高风险部分得分的人可能会受益于与他们的医生和遗传咨询师讨论这种风险,以进行进一步的健康评估。
哪些人群会从多基因风险评分中受益?
迄今为止,大多数基因组研究都检查了欧洲血统的个体。 由于这个问题,可能没有足够的来自其他人群的基因组变异数据来计算这些人群的多基因风险评分。 基因组研究中这种历史上缺乏多样性也是其他基因组学相关研究领域关注的问题,并导致人们普遍关注超出多基因风险评分的健康差异。
上图显示 78% 欧洲人、10% 亚洲人、2% 非洲人、1% 西班牙裔、0.5% 其他少数族裔、8.5% 未报告
大规模基因组研究中包含的祖先群体的百分比绝大多数是欧洲人。
在这个时间点,多基因风险评分的准确性可能只对欧洲血统人群有效和有用。 需要更多的研究来获得使多基因风险评分对其他人群有用的数据。
展望未来
卫生专业人员尚未常规使用多基因风险评分,因为没有实践指南,研究人员仍在改进这些评分的生成方式。 然而,私营医疗保健和直接面向消费者的公司已经开始为其消费者生成多基因风险评分,它们有朝一日可能成为指导医疗保健决策的重要新工具。
多基因风险评分始终是概率,而不是确定性。 了解多基因风险评分如何影响人们的生活和健康是国家人类基因组研究所支持的一个活跃研究领域。
What is a genomic variant? 所有人类在其基因组的估计有 60 亿个字母代码中都有几乎相同的 DNA 序列。个体之间存在细微的差异,使我们每个人都是独一无二的。 这些差异,称为基因组变异,发生在 DNA 内的特定位置。DNA 像代码一样被读取。 该代码由四种类型的化学构件组成 – 腺嘌呤、胸腺嘧啶、胞嘧啶和鸟嘌呤,缩写为字母 A、T、C 和 G。基因组变异发生在 DNA 中代码因人而异的位置。例如,在下面的第一个人中,该位置显示一个“C”基地。 但在第二个人的同一位置,它是一个“T”。