公告/发布日期:2022/07/26

mile米乐m6(中国)官方网站v 体细胞重复序列之间的重组分析

-发现人类基因组新的复杂性-


由理化学研究所生物医学中心转录组研究小组的研究员 Giovanni Pascarella 和小组组长 Piero Carninci、东京大学前沿科学研究生院医学信息与生命科学系生命系统观测部门的 Minoru Suzuki 教授以及米乐m6官方网站人工智能研究中心高级首席研究员 Friis Martin 组成的国际联合研究小组正在对“重复数组[1]''之间发生的重组,发现了人类基因组的新特征。

超过 50% 的人类基因组由重复序列组成,其中特定碱基序列重复出现。据报道,在患有遗传性疾病和癌症的患者中经常检测到由高度相似的重复序列之间的重组引起的突变。

这次,一个国际合作研究小组开发了一种独创的方法来系统地检测体细胞基因组中重复序列之间的重组,并发现在健康人的肝脏、肾脏和大脑中以许多组织特异性的方式发现了由于重复序列之间的重组而产生的突变。我们还发现,人类细胞分化会影响重组,重复序列重组引起的突变与阿尔茨海默病和帕金森病等神经退行性疾病有关。这说明基因组上重复序列之间的重组并不是只发生在遗传病或癌症患者身上的现象,而是发生在健康人和神经系统疾病患者中的普遍现象。

这项研究的结果预计将有助于系统地了解重复序列的组织特异性重组对人类基因组结构和疾病的影响。

这项研究发表在科学杂志'手机''将以网络版发布(7月25日:日本时间7月26日)。

概览图

发现由于体细胞基因组中重复序列之间的重组而产生的突变


背景

20多年前首次破译人类基因组草图序列时,发现超过50%的基因组由“重复序列”组成,其中特定碱基序列出现了数百万次。

人类基因组中的重复序列由长度约为 300 个碱基对的序列组成。阿鲁家族[2]” “L1 家族[2]''等。最近的研究表明,这些重复序列参与生物体的重要机制,例如调节附近基因的表达以及形成基因组的三维结构。另一方面,重复序列具有高度的相似性,这会由于重复序列之间的重组而导致突变。事实上,在癌症和遗传性疾病患者的基因组中已经发现了由 Alu 和 L1 重复序列重组引起的基因突变。然而,尚未使用各种生物组织对这些特定类型的 DNA 突变进行系统研究。

 

研究方法和结果

一个国际合作研究小组假设,在癌症和遗传疾病中报道的 Alu 和 L1 重复序列的重组只是冰山一角,实际上可能是一种更普遍的现象。

简介:为了证明这一假设,我们将使用实验方法从 DNA 样本中富集特定的基因组序列。捕获序列方法[3]'' 用于分析整个人类基因组中重复序列之间的重组。这次,我们独立设计了传统Capture-seq方法中与重复序列结合的RNA分子(探针),并进行了改进,以实现在短时间内有效浓缩DNA片段。这使得全面检测重组成为可能。

接下来,我们使用这种方法分析了来自东京都健康和老年学中心老年脑库的 10 名死后捐献者的 DNA。对于每位捐献者,DNA 均从肾脏、肝脏和三个不同大脑区域(额叶、顶叶和颞叶皮层)的组织中富集(图 1,顶部)。使用 Capture-seq 方法从这些样本中提取具有重复序列的 DNA 片段,并Illumina 下一代测序仪[5]分析碱基序列(图1右下)。此外,无需使用捕获方法或进行 PCR 扩增即可分析来自同一组织的长链 DNA。纳米孔测序仪[6]分析整个基因组序列(图1左下)。通过使用两种独立的分析方法,可以相互验证分析结果的显着性。

图1

图 1 本研究中的实验方法
为了分析 Alu 和 L1 重复序列的体细胞重组,我们分析了肾脏、肝脏和三个不同的大脑区域(神经元和神经元)。神经胶质细胞[4]单独)使用Illumina下一代测序仪对DNA进行序列分析,并使用纳米孔测序仪对通过Capture-seq方法富集的重复序列DNA片段进行全基因组序列分析。

此外,作为在序列分析后从碱基序列数据中提取Alu和L1重复序列的计算工具生物信息学管道[7]我们开发了“TE-reX”。该管道使用从样本获得的序列数据来参考基因组[8]通过与序列数据进行比较并提取不完全匹配的读段,我们识别出发生重组的位点(图 2)。

图2

图2重复序列之间重组的TE-reX检测方案
TE-reX 识别源自分别映射到参考基因组上较远位置的样本的序列,并提取待分析样本中的重组位点。使用 TE-reX,我们检测到通过 Capture-seq 方法富集的 DNA 片段(如图 1 所示)和整个基因组序列中的重组。

通过这种方法,我们从人类样本的序列数据中发现了数百万个由 Alu 和 L1 重复序列重组引起的突变。此外,我们分析了每个体细胞特有的重组并阐明了重组的特征。例如,肾脏和肝脏中每个细胞的重组数量相对较高(图 3A),而在脑组织中,在同一染色体内观察到许多重组。此外,在脑组织中,在基因组的相邻区域观察到许多涉及 Alu 和 L1 重复序列的重组(图 3B)。

图3

图3 体细胞组织特异性重组的特征
A:肾脏和肝脏中每个细胞的重组体数量高于脑组织。
B:纵轴显示源自每个组织横轴所示距离间隔的重复序列之间的重组事件的比例。在脑组织中,同一基因组相邻区域的重复序列之间的重组频率很高。

在这里,由于重组的特征因组织而异,我们假设“发育早期的生物过程可能会影响重复序列的重组。”

为了证明这个假设,iPS 细胞(诱导多能干细胞)[9]使用 Capture-seq 和 TE-reX 分析从 iPS 细胞分化的神经元的 Alu 和 L1 重复序列的重组。因此,诱导分化自 iPS 细胞的神经细胞比 iPS 细胞更加不活跃。染色质区室[10]具有重复序列之间重组增加、相邻重复序列之间重组增加等特点。这表明人类细胞分化影响体细胞的重组。

此外,当我们分析神经退行性疾病阿尔茨海默病和帕金森病患者提供的样本重组时,我们发现了疾病样本特有的几个特征。我们发现阿尔茨海默病捐献者颞叶皮层的重组增加。患有帕金森病的捐赠者经常发生重组,导致与帕金森病密切相关的基因发生 DNA 缺失。这些发现表明神经退行性疾病可能会影响重组的特定变化。

 

未来的期望

这项研究表明,体细胞中 Alu 或 L1 重复序列的重组是健康个体的人类基因组中发现的普遍特征。这些体细胞中的重组可以影响人类基因组的结构和功能。

分化过程中组织之间重组特征显着不同的发现表明,体细胞中 Alu 和 L1 重复序列之间的重组可能是生物体正常发育所必需的。此外,阿尔茨海默病和帕金森病中的重组谱发生了改变,这表明重组变化会影响脑部疾病。未来,我们希望通过评估各种疾病中重复元件之间的组织特异性重组特征,能够阐明疾病的原因并开发新的治疗方法。

 

论文信息

<标题>
重复元件的重组在人类基因组中产生体细胞复杂性
<作者姓名>
Giovanni Pascarella、Chung Chau Hon、Kosuke Hashimoto、Annika Busch、Joachim Luginbühl、Callum Parr、Wing Hin Yip、Kazumi Abe、Anton Kratz、Alessandro Bonetti、Federico Agostini、Jessica Severin、Shigeo Murayama、Yutaka Suzuki、Stefano Gustincich、Martin弗里斯和皮耶罗·卡宁奇。
<杂志>
细胞
<DOI>
101016/jcell202206032


补充说明

[1] 重复数组
指特定碱基序列在基因组上重复出现的序列。重复阵列有两种类型:相同序列在同一方向上相邻存在的类型(列重复阵列)和相同序列不相邻存在的类型(散布重复阵列)。[返回来源]
[2] Alu家族,L1家族
Alu 家族是长度约为 300 个碱基对的短散布重复序列,约占人类基因组的 10%。 L1家族是一个由大约7,000个碱基对组成的散布重复序列的长链,约占人类基因组的17%。[返回来源]
[3] Capture-seq 方法
一种浓缩含有特定基因组区域的 DNA 片段并进行序列分析的方法。使用具有与目标区域互补的碱基序列的探针进行杂交来捕获特定的DNA片段。在本研究中,通过为重复序列设计独特的探针,与传统方法相比,我们显着缩短了富集所需的时间,并进行了改进,能够高效检测更罕见的突变。[返回来源]
[4] 神经胶质细胞
也称为神经胶质细胞。大脑中除神经细胞以外的许多细胞的总称,包括星形胶质细胞、少突胶质细胞和小胶质细胞。[返回来源]
[5] Illumina 下一代测序仪
Illumina 开发的下一代测序仪。这是一种使用荧光核苷酸的合成序列等技术读取 DNA 碱基序列的装置,与桑格法相比,吞吐量显着提高。[返回来源]
[6] 纳米孔测序仪
由 Oxford Nanopore Technologies 开发的测序仪。一种从 DNA 分子穿过带有纳米级孔的蛋白质时产生的电信号读取碱基序列的方法。与目前广泛用作下一代测序仪的Illumina的读取方法相比,该方法的优点是能够分析长DNA分子而不将其打碎。[返回来源]
[7] 生物信息学管道
生物信息学是利用计算机分析生物所拥有的各种信息的领域。通过将计算处理的步骤分开并将执行独立处理的步骤连接到同一字段的管道方法,可以优化并加速分析。[返回来源]
[8] 参考基因组
作为标准基因组序列发布的物种基因组序列。通过将读取的数据与参考序列进行比对,可以检测到与标准参考序列不同的 DNA 多态性。在本研究中,我们使用了人类基因组参考GRCh38,其碱基总数约为3 Gb,由基因组参考联盟发布。[返回来源]
[9] iPS 细胞(诱导多能干细胞)
早期脊椎动物胚胎分化为所有类型体细胞的能力称为多能性。多能干细胞是具有多能性并且可以通过体外培养无限期生长的细胞。 iPS 细胞用于成人血液和皮肤细胞10 月 3 日红袜2Klf4多能干细胞是通过引入基因等人工创建的。[返回来源]
[10] 染色质区室
染色质是 DNA 和蛋白质的复合物,高度折叠并排列在细胞核内称为染色质区室的区域中。在细胞核内,A 区室和 B 区室形成区域,其中基因转录在前者中被激活,而在后者中被抑制。已知亚核区室根据细胞分化和细胞周期而变化。 [返回来源]
 

国际联合研究组

理化学研究所生物医学科学研究中心
转录组研究团队
团队负责人皮耶罗·卡宁奇
(人类科技极团队负责人)
研究员乔瓦尼·帕斯卡雷拉
研究员(研究时)桥本浩介
(现任大阪大学蛋白质研究所计算生物学实验室副教授)
客座工程师 Wing Hin Yip
访问研究员 Alessandro Bonetti
技术人员(研究时)Annika Busch
基因组信息分析团队
队长钟秋汉
基因调控电路研究团队
研究员卡勒姆·帕尔
研究员(研究时)Joachim Luginbühl
应用计算基因组学研究团队
工程师杰西卡·塞维林
东京大学前沿科学研究生院、医学信息与生物技术系、生命系统观测系
铃木裕教授
国立产业技术综合研究所信息工学部
高级首席研究员弗里斯·马丁
(东京大学前沿科学研究生院医学信息生物技术系大规模生物信息分析系教授)
卡罗林斯卡学院
研究员费德里科·阿戈斯蒂尼
加州大学圣地亚哥分校
助理研究员安东·克拉茨
意大利理工学院 (IIT)
副总监斯特凡诺·古斯汀西奇
东京健康老年医学中心研究所
研究总监村山繁雄
 

研究支持

这项研究得到了日本医学研究与发展机构 (AMED) 脑科学研究战略促进计划的研发项目“建立老龄化和痴呆症中心”(研发代表:Shigeo Murayama)的支持。此外,我们还获得了日本学术振兴会(JSPS)创新领域科学研究补助金(研究领域提案类型)、“学术研究支持平台形成”和“队列和生物样本支持平台(CoBiA)”(核心机构:东京大学医学科学研究所)的样本提供和分析支持。



联系我们

查询表