2022年5月16日,瀚因生命创始人兼首席科学家、中国科学技术大学生命科学与医学部瞿昆教授所率领的课题组通过设计一整套分析流程,系统性评估了16种空间转录组和单细胞转录组数据整合算法在预测基因或细胞类型空间分布方面的性能,为研究人员选择最佳数据分析工具提供了指南,并为研究人员进行新的算法开发提供了理论基础。该项研究成果以《Benchmarking spatial and single-cell transcriptomics integrationmethods for transcript distribution prediction and cell type deconvolution》为题,发表于国际知名杂志Nature Methods。
(文章链接:https://www.nature.com/articles/s41592-022-01480-9,IF=28.547)
图1:瀚因生命创始人兼携手中科大发表Nature Methods文章
空间转录组学是2020年Nature methods评选的年度方法,是当前单细胞组学研究领域的新方向,在肿瘤学、病理学、免疫学、发育生物学等诸多临床领域具有广泛的应用前景。然而目前空间转录组学技术路线均存在一定的局限性,无法真正意义上实现对空间中单个细胞完整转录组信息的精确刻画。为了突破空间转录组技术在实验室上的局限性,生物信息学家提出了各类理论工具,通过整合空间转录组与单细胞转录组数据,预测细胞类型的空间分布和全转录本的空间定位。针对不同算法在预测基因和细胞的空间分布方面的性能,目前尚无系统性的比较。
基于此,瀚因生命创始人兼首席科学家,瞿昆教授率领课题组设计了一套标准流程来系统性评估不同整合算法的性能,课题组从已发表的研究中收集了45对空间转录组学和单细胞转录组配对数据集,并从16个配对的单细胞转录组数据集中生成了32对模拟数据集,采用多种指标(PCC,SSIM,RMSE,JS)评估了不同算法在不同数据集上的表现。
图2:整合分析流程
课题组研究发现,在预测基因空间分布方面,Tangram、gimVI和SpaGE的预测准确度和稳定性更高,而Seurat,LIGER的计算效率最高,适合处理大规模数据集;在预测细胞类型分布方面,Cell2location、SpatialDWLS和RCTD能更加准确的预测细胞类型的空间分布,而Tangram和Seurat是计算效率最高的整合工具(图3)。
图3:不同整合工具的比较结果
该项研究提供了一整套系统评估空间转录组分析算法的流程和数据集,总结了每种算法的属性、性能和适用性,归纳了高效算法的优势,为研究人员进一步提升算法性能提供了参考;并通过共享整合空间转录组和单细胞转录组数据的分析流程,以帮助研究人员为处理自己的数据选择最佳的分析工具。
关于
瀚因生命
瀚海寻因,生命启航
致力于eccDNA新模态临床测序技术及临检产品开发
瀚因生命团队具有丰富的临床组学测序技术、及生物信息学算法开发经验,相关研究发表在Nature, Cell, Nature Methods,Cancer Cell,GenomeBiology等高水平学术期刊。团队自2020年五月成立以来,已建立合肥实验中心和杭州生信中心双平台,全力打造围绕eccDNA血液检测的泛癌早筛/伴随诊断/预后跟踪等肿瘤全周期产品管线。
扫码关注官方公众号
扫码关注环环测公众号
扫码进入环环测小程序
环环测咨询电话:400-007-5070 合作电话:15958809922 地址:浙江省杭州市萧山区萧山科技城传化科创大厦A座701-B