发布网友 发布时间:3小时前
共1个回答
热心网友 时间:3小时前
单细胞测序技术的原理与应用
单细胞测序技术的应用日渐普及,然而,关于其上游信息的搜索结果众多,本文仅对自我关注的方向进行总结。
在单细胞测序中,dropout现象指测序技术本身缺陷导致本应表达的基因未被检测,比例极高。单细胞dropout分为两部分,在神经网络中dropout是一种正则化手段,批次效应则是由不同时间、操作者、试剂、仪器导致的实验误差,影响细胞表达量。批次效应无法完全去除,但可通过拟合模型评估减少其影响。
目前有20多种单细胞测序技术,性能差异显著。例如,2020年西班牙科学家在Nature上发表的论文《Benchmarking single-cell RNA-sequencing protocols for cell atlas projects》比较了13种常用scRNA-seq和单核RNA-seq实验方案,显示出实验方案在文库复杂性及细胞类型标记能力上的差异,影响预测价值与参考细胞图谱整合适用性。此外,Microwell-seq技术由郭国骥教授团队开发,成本大幅降低,但技术细节较为复杂。
在主流技术中,Smart-seq2是一个具有代表性的技术。其建库原理及优缺点已在百度上有所介绍,但本文仅提及对后续数据分析有重大影响的优点和缺点。另一方面,10X Genomics技术通过将细胞与凝珠混合包裹在油滴中,实现细胞裂解并释放barcodes。10xbarcode用于编码细胞,umi编码基因,减少dropout现象。
单细胞测序技术已超越简单批次效应,技术差异显著。因此,跨数据集分析需谨慎,特殊整合或矫正方法可能导致数据损坏。使用深度学习框架时,需注意框架适用性,跨数据集分析成本巨大。
单细胞数据分析流程已有成熟框架,如Seurat。该流程包括数据清洗、注释、聚类分析等步骤,适用于下游数据分析。流程完善,运行速度快,可信度高。