scanpy 单细胞分析API接口使用案例
创始人
2024-05-27 05:31:08
0

参考:https://zhuanlan.zhihu.com/p/537206999
https://scanpy.readthedocs.io/en/stable/api.html
在这里插入图片描述

scanpy python包主要分四个模块:
1)read 读写模块、
https://scanpy.readthedocs.io/en/stable/api.html#reading
在这里插入图片描述
2)pp Preprocessing 预处理模块
https://scanpy.readthedocs.io/en/stable/api.html#module-scanpy.pp
在这里插入图片描述
3)tl Tools工具箱模块,包括降维聚类等算法
https://scanpy.readthedocs.io/en/stable/api.html#module-scanpy.tl
在这里插入图片描述
3)pl Plotting画图模块
https://scanpy.readthedocs.io/en/stable/api.html#module-scanpy.pl
在这里插入图片描述

使用案例

import numpy as np
import pandas as pd
import scanpy as sc## 加载数据
adata = sc.datasets.pbmc3k()
adata.var_names_make_unique()#质量控制
# 查看高表达的前20个基因
sc.pl.highest_expr_genes(adata, n_top=20, save='_pbmc3k.png')#######预处理##############
sc.pp.filter_cells(adata, min_genes=200)
sc.pp.filter_genes(adata, min_cells=3)
adata.var['mt'] = adata.var_names.str.startswith('MT-')  # annotate the group of mitochondrial genes as 'mt'
sc.pp.calculate_qc_metrics(adata, qc_vars=['mt'], percent_top=None, log1p=False, inplace=True)#查看
sc.pl.violin(adata, ['n_genes_by_counts', 'total_counts', 'pct_counts_mt'],jitter=0.4, multi_panel=True, save='_pbmc3k.png')adata = adata[adata.obs.n_genes_by_counts < 2500, :]
adata = adata[adata.obs.pct_counts_mt < 5, :]
#总计数归一化、对数化
sc.pp.normalize_total(adata, target_sum=1e4)
sc.pp.log1p(adata)# 识别高度可变的基因
sc.pp.highly_variable_genes(adata, min_mean=0.0125, max_mean=3, min_disp=0.5)
sc.pl.highly_variable_genes(adata, save='_pbmc3k.png')# 保存原始数据
adata.raw = adata# 过滤
adata = adata[:, adata.var.highly_variable]# 将数据缩放到单位方差
sc.pp.regress_out(adata, ['total_counts', 'pct_counts_mt'])
sc.pp.scale(adata, max_value=10)#######降维聚类分析##############sc.tl.pca(adata, svd_solver='arpack')
sc.pl.pca(adata, color='CST3', save='_pbmc3k_CST3.png')
sc.pl.pca_variance_ratio(adata, log=True, save='_pbmc3k_pc.png')
sc.pp.neighbors(adata, n_neighbors=10, n_pcs=40)sc.tl.umap(adata)
sc.pl.umap(adata, color=['CST3', 'NKG7', 'PPBP'], save='_pbmc3k_CST3_NKG7_PPBP.png')sc.tl.leiden(adata)
sc.pl.umap(adata, color=['leiden'], save='_pbmc3k_leiden.png')

相关内容

热门资讯

保存时出现了1个错误,导致这篇... 当保存文章时出现错误时,可以通过以下步骤解决问题:查看错误信息:查看错误提示信息可以帮助我们了解具体...
汇川伺服电机位置控制模式参数配... 1. 基本控制参数设置 1)设置位置控制模式   2)绝对值位置线性模...
不能访问光猫的的管理页面 光猫是现代家庭宽带网络的重要组成部分,它可以提供高速稳定的网络连接。但是,有时候我们会遇到不能访问光...
表格中数据未显示 当表格中的数据未显示时,可能是由于以下几个原因导致的:HTML代码问题:检查表格的HTML代码是否正...
本地主机上的图像未显示 问题描述:在本地主机上显示图像时,图像未能正常显示。解决方法:以下是一些可能的解决方法,具体取决于问...
表格列调整大小出现问题 问题描述:表格列调整大小出现问题,无法正常调整列宽。解决方法:检查表格的布局方式是否正确。确保表格使...
不一致的条件格式 要解决不一致的条件格式问题,可以按照以下步骤进行:确定条件格式的规则:首先,需要明确条件格式的规则是...
Android|无法访问或保存... 这个问题可能是由于权限设置不正确导致的。您需要在应用程序清单文件中添加以下代码来请求适当的权限:此外...
【NI Multisim 14...   目录 序言 一、工具栏 🍊1.“标准”工具栏 🍊 2.视图工具...
银河麒麟V10SP1高级服务器... 银河麒麟高级服务器操作系统简介: 银河麒麟高级服务器操作系统V10是针对企业级关键业务...