华盛顿大学Brotman Baty研究所的UW Medicine研究人员发布了两大重要图谱,可以用于追踪人类细胞和组织发育过程中的基因表达和染色质可及性。
这一成果公布在11月13日的Science杂志上,一个图谱定位了15个胎儿组织中单个细胞内的基因表达;第二个图谱描绘了细胞内单个基因的染色质可及性。
基因表达图谱
基因表达是细胞利用DNA中的信息指导蛋白质合成的过程。这些蛋白质决定了细胞的结构和功能。基因表达图谱揭示了在不同细胞类型中细胞生长和发育过程中何时和何地基因表达。
文章一作Junyue Cao说:“根据这些数据,我们可以直接生成人类组织中所有主要细胞类型的目录,包括这些细胞类型在组织中的基因表达如何变化。”
为了创建图谱,研究人员采用了一种称为sci-RNA-seq3的技术,在15种类型的胎儿组织中分析了基因表达。这项技术用三个DNA“条形码”的独特组合标记每个细胞,从而使研究人员无需物理分离即可跟踪细胞。
一旦获得序列,研究人员就使用计算机算法来恢复单细胞信息,按类型和亚型对细胞进行聚类,并确定它们的发育轨迹。科学家们分析了超过400万个单细胞,并鉴定出77种主要细胞类型和大约650种细胞亚型。
他们还将图谱与现有的小鼠胚胎发育图谱进行了比较。 文章另外一位作者Cole Trapnell解释说:“当我们将这些数据与先前发表的数据结合在一起时,我们可以直接描绘出所有主要细胞的细胞发育路径类型。”
染色质可及性图谱
染色体可将DNA紧密包装在细胞核中,染色质可以对读取DNA中编码的遗传指令进行分子机器开放和封闭的指令,了解打开和关闭的DNA区域可以告诉科学家们细胞如何选择打开和关闭基因的。
通讯作者Darren Cusanovich说:“研究染色质可以发现细胞的调节性‘语法’要求。开放或可访问的DNA富含某些“词语”,这些词语反过来又是细胞确定其需要某些基因的基础。”
为了描述单个细胞中DNA的可及性,科学家们开发了一种称为sci-ATAC-seq3的新方法。像sci-RNA-seq3一样,这一方法也在每个细胞中使用三种不同的DNA“条形码”来标记和跟踪单个细胞。但是,sci-ATAC-seq3并不是识别所有当前表达的序列,而是捕获并打开了染色质位点。
在这项研究中,科学家在15个胎儿组织的约100万个位置上生成了近80万个单细胞染色质可及性概况。他们解析了哪些蛋白质可能与每个细胞中的可及DNA位点相互作用,以及这些相互作用如何影响细胞类型。
“这告诉我们基因组的哪些部分可能起作用。我们仍然不知道不编码基因的基因组中有多少会参与基因调控。我们的图谱现在提供了许多细胞类型的信息。”
原文标题:
A Human Cell Atlas of Fetal Gene Expression
A Human Cell Atlas of Chromatin Accessibility