单细胞组学日益强大的力量:改变医学的未来

20 - 1月- 2021

细胞和组织的单细胞基因组分析的进展,包括所需的计算方法,现在已经使我们能够获得所有人类细胞的系统、高分辨率和全面的参考图。Paradigm4的首席执行官兼联合创始人Marilyn Matz和生命科学与医疗保健副总裁Zachary Pitluk博士报告

单细胞组学日益强大的力量:改变医学的未来

这方面的一个例子是人类细胞图谱(HCA)项目,这是一个国际合作项目,旨在根据独特的分子特征(如基因表达)定义所有人类细胞类型,并将这些信息与经典的细胞描述(例如位置和形态)联系起来。1

细胞图谱的转译前景从人类机体的基础生物学到疾病机制、诊断、预后,从治疗监测到免疫治疗、药物开发和细胞和器官替代。2

复杂的单细胞分析平台使研究人员能够从HCA等数据库中收集关键的见解,帮助他们更好地理解许多疾病的机制。中国现在也正在成为国际社会应对SARS-CoV-2努力的重要贡献者。3.

精准医疗的愿景是一种理想的“新状态”,在这种状态下,相关可靠的数据为临床决策提供信息,并允许每个患者得到比目前可能的更适当的治疗。由于技术的进步,特别是在数据处理和分析领域,以及这种技术正在实现的突破性单细胞研究,这种愿景正在变得越来越近。

游戏规则改变者

单细胞分析被广泛认为是一种开创性的技术;它允许在单细胞水平上进行组学分析——特别是基因组学、转录组学、表观基因组学和蛋白质组学,并能够识别例如可能在生物过程中发挥关键作用的细胞的微小亚群。

它还可以提供一种超灵敏的工具来阐明对治疗和途径的特定分子反应,从而揭示细胞异质性的本质。

这将精准医疗的咒语从“正确的病人,正确的目标”扩展到包括“正确的细胞类型”。

有了这个新的工具箱,研究人员和临床医生可以深入了解从“健康”到“疾病”状态的转变,研究潜在的生物标志物,了解疾病途径的机制,并随着时间的推移评估对药物靶标或可用治疗方案的反应。

细胞与患者

重要的是要认识到,目前的单细胞数据集是由少数个体生成的,统计显著性依赖于研究的患者数量,而不是细胞数量。

这是因为来自同一病人的细胞是“兄弟姐妹”,而不是真正的生物复制。因此,包含数十万患者/治疗条件的数据集将需要技术来管理数十亿个细胞。

例如,HCA的免疫细胞调查目前包含780,000个细胞,但这些细胞仅来自16个个体。HCA本身只有不到400名患者,很少有人捐赠来自一个以上器官系统的细胞。

随着研究人员研究细胞(亚)种群的进化和治疗的影响,这种“细胞-患者-数据”的关系进一步复杂化。

如果我们要获得制药研发中统计能力所需的大量患者和治疗条件的数据集,那么开发管理来自数十亿个细胞的数据的创新技术是至关重要的。

在细胞疗法的背景下,能够以cgmp兼容的方式在制造过程中监测数十亿个单个细胞将是至关重要的。

单细胞组学日益强大的力量:改变医学的未来

利用人类基因数据

受低效率、成本上升和具有挑战性的监管/报销环境的困扰,大型制药公司已经转向新的研发方法,寻求利用目前产生的大量人类基因数据。4

需要一个单一、统一的存储库来存储一个组织的整个单单元数据(包括原始数据和规范化数据),这些数据直观地组织起来,并支持来自无限用户的安全数据交易,而不是长期使用文件和数据筒仓。

目前的工具限制了交叉研究分析,而交叉研究分析对于确认结果至关重要。

数据的稀疏性限制了单细胞组学数据最大价值的提取,这是一个根本原因。例如,在单细胞RNA测序中,当给定细胞中的某个基因没有唯一的分子标识符或对其的读取映射时,测量值中会出现大量观测到的零。5

观察到的零的比例,或稀疏程度,可以阻碍下游的分析性能,并需要大量的生物信息学专业知识来处理存储和计算。

需要统计模型固有地解释单细胞RNA测序数据的稀疏性、采样变化和噪声模式,并使用适当的数据生成模型。

案例研究:COVID-19

在大型单细胞数据集中评估关键基因(如编码关键病毒入口相关蛋白的基因)的表达谱可以促进诊断、治疗和疫苗靶点的测试。

例如,最初的工作旨在在单细胞水平上了解SARS-CoV-2病理,其中一些工作使用了以前生成的HCA数据,重点是了解哪些细胞类型表达编码SARS-CoV-2受体的基因,ACE2

最近的研究表明,除了由SARS-CoV-2感染引起的特征明显的呼吸道疾病外,该病毒还可引起包括胃肠道、心血管系统、内分泌系统和中枢神经系统在内的全身性病理。6 - 9

进一步阐明这些观察结果与受体和基因表达谱的组织/细胞分布之间的关系是时间紧迫的。

一项研究评估了一种新的单细胞数据分析平台(paradigm m4的REVEAL Single Cell)在查询HCA和COVID细胞图谱(CCA)数据库中的所有细胞方面的能力ACE2受体,TMPRSS2(进入促进酶跨膜丝氨酸蛋白酶)或共表达这两个标记(图1)。10

大部分细胞都在表达ACE2细胞类型标记为PC_vent1(心脏组织);大部分细胞表达TMPRSS2细胞类型标记为AT2(肺泡上皮II型细胞,见于肺实质);大多数细胞同时表达两者ACE2TMPRSS2标记为胆囊细胞。

图1:表达ACE2和/或TMPRSS2的细胞在不同器官系统中的百分比分布

图1:表达ACE2和/或TMPRSS2的细胞在不同器官系统中的百分比分布

这些结果在一定程度上解释了在持续的COVID-19大流行期间全球范围内观察到的受感染患者的多器官受累性,因为人体中的多种细胞类型表达了SARS-CoV-2用于感染的基因。

paradigm m4的科学分析引擎能够快速(不到60秒)分析感染中涉及的关键基因,并支持需要通过大型单细胞表达数据集数据库进行评估的其他用例,如传染病的候选疫苗、肿瘤患者分级的生物标记物和免疫相关疾病。

这说明了像REVEAL Single Cell这样的分析引擎在支持大型稀疏数据集的发现方面的价值,符合研究界的需求。

激动人心的未来触手可及

单细胞分析为科学家提供了广阔的前景,并可能提供一种方法来揭示组织之间的生理联系,这是我们以前没有希望看到的。

这如何转化为精准医学的进步,评估表观遗传因素的影响,开发日常健康预测模型,以及治疗研究和开发,在很大程度上依赖于从生成的多组学数据中提取最大价值,并将其组装成细胞图谱,如HCA。

如果没有强大的计算工具,就不可能将这些现有存储库与研究(如正在进行的COVID-19工作)集成在一起。

通过优化处理、数据管理和分析方法来提取转化价值,找到基因表达指纹和不同细胞类型的能力,这些细胞类型可能看起来完全不像,但可能彼此对应,这可能会改变我们诊断和治疗疾病的方式。

如果单细胞分析的全部潜力得以实现,我们将能够从分子上探索人类的生理学。

注册你的免费电子邮件通讯

参考文献

  1. https://doi.org/10.1101/121202。
  2. www.humancellatlas.org/wp-content/uploads/2019/11/HCA_WhitePaper_18Oct2017-copyright.pdf。
  3. https://doi.org/10.1038/s41580 - 020 - 0267 - 3。
  4. www.gsk.com/media/5041/rd-update-slides-hal-barron.pdf。
  5. https://doi.org/10.1186/s13059 - 020 - 1926 - 6。
  6. K.S.张,,“SARS-CoV-2感染的胃肠道表现和香港队列粪便样本中的病毒载量:系统回顾和荟萃分析,”胃肠病学159(1), 81-95(2020)。
  7. https://doi.org/10.1101/2020.04.06.028522。
  8. N.P. Somasundaram,et al。《SARS-Cov-2病毒感染对内分泌系统的影响》,内分泌学会杂志4(8), bvaa082(2020)。
  9. 美国纳贾尔,et al。“与SARS-CoV-2感染相关的中枢神经系统并发症:病理生理学和病例报告的综合概念”,j .神经炎症17, 231(2020)。
  10. https://doi.org/10.1101/2020.06.24.169730。

公司

Baidu