自建站shopify,福建巢网站建设,页面编辑wordpress,企业网站源码 php搜索文献#xff0c;发现一篇非常好的单细胞和空间转录组学联合分析的好文章#xff0c;带有全套复现代码。从今天开始#xff0c;我们就来系统学习一下。文章的题目是#xff1a;Single cell and spatial transcriptomics highlight the interaction of club-like cells w…搜索文献发现一篇非常好的单细胞和空间转录组学联合分析的好文章带有全套复现代码。从今天开始我们就来系统学习一下。文章的题目是Single cell and spatial transcriptomics highlight the interaction of club-like cells with immunosuppressive myeloid cells in prostate cancer。代码托管在 Githubhttps://github.com/akiviaho/ST-prostate文章的主要内容前面已经作了简要介绍全套复现代码 | 单细胞和空间转录组学揭示前列腺癌耐药性的新驱动因素本研究揭示了棒状细胞导致的前列腺癌耐药恶性循环如下图所示如果你对这篇文章的复现感兴趣可以加我微信usegalaxy拉你入群一块交流。我们先来看一下文章用到的主要数据。文章数据该研究涉及空间转录组ST、单细胞转录组scRNA-seq参考集及外部验证数据。1. 空间转录组数据 (ST)◦ 发现队列包含 80 个新鲜冷冻组织切片来自 56 名患者涵盖良性BPH、初治TRNA、新辅助治疗NEADT和去势抵抗CRPC阶段。数据已上传至 GEO登录号为 GSE278936。◦ 验证队列来自 8 名初治患者的 32 个切片。数据存储在 EGA登录号为 EGAD50000000603。◦ 转移癌数据包含 4 个转移灶样本盆腔淋巴结、肝、心包、硬脑膜。2. 单细胞参考图谱 (scRNA-seq Reference)◦ 研究整合了多项已发表的数据集共 98 个样本、64 名患者、223,881 个细胞来定义 26 种细胞状态。◦ GEO 登录号GSE137829, GSE141445, GSE176031, GSE185344, GSE181294以及 SRA: PRJNA699369 和 Broad Institute 研究 SCP1244。3. 外部 Bulk 验证数据◦ TCGA-PRAD 和 SU2C-PCF (mCRPC) 队列数据预处理import numpy as np import pandas as pd import scanpy as sc import anndata as ad from pathlib import Path import glob import warnings warnings.filterwarnings(ignore) import os os.chdir(/pub/sci-paper/2024_spatial_prostate)Formatting Dong et al. 2020 data我们先下载 dong_2020 参考数据GEO 编号GSE137829。需要注意的是这个数据的 Series Matrix File(s) 文件中只有注释信息而表达数据存在于补充文件 GSE137829_RAW.tar。解压后得到 6 个.txt 文件galaxygalaxy:/pub/sci-paper/2024_spatial_prostate/sc-reference/dong_2020$ ll -lsh *.txt 179M -rw-rw-r-- 1 galaxy galaxy 179M Sep 23 2019 GSM4089151_P1_gene_cell_exprs_table.txt 63M -rw-rw-r-- 1 galaxy galaxy 63M Sep 23 2019 GSM4089152_P2_gene_cell_exprs_table.txt 68M -rw-rw-r-- 1 galaxy galaxy 68M Sep 23 2019 GSM4089153_P3_gene_cell_exprs_table.txt 72M -rw-rw-r-- 1 galaxy galaxy 72M Sep 23 2019 GSM4089154_P4_gene_cell_exprs_table.txt 469M -rw-rw-r-- 1 galaxy galaxy 469M Aug 5 2020 GSM4711414_P5_gene_cell_exprs_table.txt 436M -rw-rw-r-- 1 galaxy galaxy 436M Aug 5 2020 GSM4711415_P6_gene_cell_exprs_table.txt接着从文章的附件中下载注释文件wget https://static-content.springer.com/esm/art%3A10.1038%2Fs42003-020-01476-1/MediaObjects/42003_2020_1476_MOESM4_ESM.xlsx稍加整理后开始合并样本数据代码有适当调整import numpy as np import pandas as pd import scanpy as sc import anndata as ad from pathlib import Path import glob import warnings warnings.filterwarnings(ignore) import os os.chdir(/pub/sci-paper/2024_spatial_prostate) # Formatting Dong et al. 2020 data sc_files glob.glob(sc-reference/dong_2020/*txt) dong_annot pd.read_csv(sc-reference/dong_2020/dong_2020_annot.csv,sep,,index_col0) dong_annot dong_annot.rename(columns{CellType:celltype_orig}) # Download the files into a list and concatenate together adata_list [] for file in sc_files: s_abbr _.join(file.split(/)[2].split(_)[0:2]) df pd.read_csv(file, sep\t, index_col1) df df.iloc[:, 1:] adata ad.AnnData(df.T) #### ADDING METADATA #### adata.obs_names s_abbr _ adata.obs_names meta adata.obs.copy() meta[sample] s_abbr meta[patient] s_abbr meta meta.merge(dong_annot,howleft,left_indexTrue,right_indexTrue) meta[phenotype] CRPC meta[dataset] dong_2020 adata.obs meta.copy() ########## adata.obs_names_make_unique() # Since the genes were originally named with ENSEMBL ID, we have to make them unique. adata.var_names_make_unique() adata_list.append(adata) adata_concat ad.concat(adata_list, joinouter, fill_value0) adata_concat.obs adata_concat.write(sc-reference/dong_2020/adata_obj.h5ad)好了我们今天先整理到这里明天见~推荐阅读中国银河生信云平台UseGalaxy.cn致力于零代码生信分析。平台拥有海量计算资源、3000 多个生信工具和数十条生信流程并且为用户提供 200G 免费存储空间。进群交流请先加 usegalaxy 为好友。我们还为进阶用户提供高质量培训课程RNA-seq数据分析实战 | 2026年第1期开启你的生信学习之旅