💡专注R语言在🩺生物医学中的使用
设为“星标”,精彩不错过
TCGA官网在2024年2月8号发布了重大更新,这次更新是自2016年GDC data portal上线以来最大的更新了,直接更新到了2.0,界面和使用方式完全不一样了!旧版页面目前(2024.2.12)还能访问,但是不久后将彻底下线!
首先是页面大更新,全新的使用界面:
图片
新版界面这次更新最大的改变是采用了以队列为中心的工作流程,用户可以自己选择想要分析的数据,也就是构建自己的队列。之前是以program为中心的,比如TCGA-COAD这种。
图片
image-20240218074026630现在首先要通过Cohort Builder选择自己想要分析的队列,然后可以对这个队列进行各种分析。新版TCGA还增加了许多新的分析工具,大家可以自行探索。
新的工作流程:
图片
数据下载假如我们想要下载TCGA-COAD的转录组基因表达数据,在新页面需要这样做:
先到Cohort Builder选择你的队列:TCGA-COAD:
图片
image-20240218080332757然后再到Respository中选择你的数据类型,最后加入购物车即可:
图片
image-20240218080552794最后到购物车下载即可。
图片
简便下载方式当然是通过easyTCGA下载了!目前依然能用。
安装方式:
# 先安装依赖包# 安装bioconductor上面的R包# 首先要改镜像,下面是清华的镜像,有时会有问题,可更改其他镜像试试(自己百度下喽~)options(BioC_mirror="https://mirrors.tuna.tsinghua.edu.cn/bioconductor")if(!require("BiocManager")) install.packages("BiocManager")if(!require("TCGAbiolinks")) BiocManager::install("TCGAbiolinks")if(!require("SummarizedExperiment")) BiocManager::install("SummarizedExperiment")if(!require("DESeq2")) BiocManager::install("DESeq2")if(!require("edgeR")) BiocManager::install("edgeR")if(!require("limma")) BiocManager::install("limma")# 安装cran上面的R包if(!require("survival")) install.packages("survival")if(!require("broom")) install.packages("broom")if(!require("devtools")) install.packages("devtools")if(!require("reshape2")) install.packages("reshape2")if(!require("data.table")) install.packages("data.table")if(!require("ggplot2")) install.packages("ggplot2")if(!require("ggpubr")) install.packages("ggpubr")# 再安装easyTCGAdevtools::install_github("ayueme/easyTCGA")
比如下载以上数据,只需要1行代码即可完成:
getmrnaexpr("TCGA-COAD")
下载的数据和官方完全一致,并且会自动进行整理,帮你把mRNA和lncRNA分开,并分别整理成tpm、fpkm、count矩阵,还会自动给你整理各种临床信息,如果你的网络没问题,只需要几分钟就可以得到以下数据:
图片
image-20240218081331857更多的细节和使用方式,大家可以去github观看:https://github.com/ayueme/easyTCGA
本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报。