全网最全!TCGA新版数据下载与整理教程来了!来抄作业!

Hi火币pro官网下载,大家好,我是晨曦

今天这期推文火币pro官网下载,我们暂时先中断一下孟德尔随机化的学习(Ps:绝对不是还没有写完QAQ)

这期推文其实很早就想写出来了火币pro官网下载,因为TCGA数据库的更新已经过去几个月的时间了,但是因为种种原因一直到今天才可以和大家见面,那么这期推文的主题自然是不言而喻,我们一起来看一下新版本TCGA数据库的下载

那么火币pro官网下载,我们就开始吧

引言

TCGA数据库在四月份的时候经历了一次更新火币pro官网下载,这次更新可能就会导致很多小伙伴以前TCGA下载的代码就无法使用了,那么正好,晨曦本身其实是非肿瘤领域的,对于肿瘤数据的使用并不是十分熟悉,也就是约等于大萌新,正好趁这个机会和大家一起进行学习

首先火币pro官网下载,TCGA数据库这次更新,主要是把数据进行了整合,因为我们经常使用的其实是转录组层面的数据,所以针对转录组层面的更新主要有以下几点:

1.TCGA转录组层面的数据进行了打包火币pro官网下载,也就是说一次下载可以得到counts、TPM、FPKM三种类型的数据,而不需要我们单独下载;

2.TCGA数据采用了最新的注释且Gene symbol已经帮助我们注释好了火币pro官网下载,不需要我们额外进行注释;

3.转录组层面的数据自带RNA类型火币pro官网下载,也就是说我们可以方便的区分编码RNA和非编码RNA;

更新主要就是在上述这三方面火币pro官网下载,然后关于数据的下载,网络上其实有很多教程,但是晨曦这里推荐大家使用TCGAbiolinks包来下载数据,因为真的很方便同时也可以节省我们整理数据的时间,那么我们下面就进行代码演示

代码演示

if (!requireNamespace("BiocManager", quietly = TRUE))install.packages("BiocManager")BiocManager::install("BioinformaticsFMRP/TCGAbiolinksGUI.data")BiocManager::install("BioinformaticsFMRP/TCGAbiolinks")

一个是 先行版火币pro官网下载,一个则是 稳定版,下载 哪个都是可以的,TCGAbiolinks包如果下载的时候出现是否更新依赖包,可以先选择不更新,如果报错,那么就老老实实的更新就可以,因为TCGAbiolinks包中的某些依赖包要求的版本型号

#查看可以下载的数据类型getGDCprojects$project_id

COAD <- GDCquery(project = "TCGA-COAD",data.category = "Tranome Profiling",data.type = "Gene Expression Quantification",workflow.type = "STAR - Counts")GDCdownload(COAD,method="api")

展开全文

上述代码运行完毕后火币pro官网下载,会在你的 当前路径下创建一个GDCdata文件夹,然后并会自动连接TCGA网站进行数据的下载,那么这个时候问题来了, 这里和以前的代码有什么区别呢?

既然解答完了第一个问题火币pro官网下载,那么我们继续~

我们可以看到通过GDCprepare函数整理后的数据包含了以上数据类型火币pro官网下载,那么这里我们只需要知道下面这几种就可以,分别是:

1.Counts = "unstranded"

2.tpm = "tpm_unstrand"

3.fpkm = " fpkm_unstrand"

然后我们既然了解了数据类型火币pro官网下载,那么我们就需要进一步把我们需要的数据提取出来

这个时候火币pro官网下载我们需要 进一步处理我们的数据来让它符合我们后续的要求

然后我们就需要 把我们感兴趣的信息提取出来火币pro官网下载,然后 和表达数据进行组合

然后接下来我们只需要通过 简单的取子集或者filter函数就可以获得mRNA表达数据还是lncRNA数据(注意:一般我们下载的转录组都会提供mRNA和lncRNA的表达数据火币pro官网下载,我们简单提取就可以了)

至于如何获得分组信息火币pro官网下载,那个和以前并没有任何区别,也就是说以前的代码在这里是没有改动的,可以直接套用

然后到这里我们就掌握了mRNA以及lncRNA数据的下载火币pro官网下载,是不是感觉TCGA更新后让我们处理数据更加简单便捷了呢~

然后再简单浏览一下关于临床数据的下载火币pro官网下载,也是很简洁的

当然火币pro官网下载,很多小伙伴会说,有没有全部癌症和临床数据都下载好的 打包形式啊,其实这项工作已经有很多老师做过这类整理工作了,各位小伙伴可以在公众号搜索一下,就能看到别的老师打包好的数据,但是对于网速可以的小伙伴,现用现下载也是没有任何问题的

那么火币pro官网下载,本期推文到这里就结束啦~

小小OS:除非是那些比较曲折以及管理比较严格的数据(比如单细胞EGA数据库的数据)火币pro官网下载,否则数据下载只要有一个普适的需求,那么一定会在网上找到相关的方法,本期推文希望可以成为各位小伙伴的一个“引路人”,帮助各位小伙伴快速简洁的掌握TCGA数据下载,那么这篇推文就达到了晨曦书写他的目的,参考教程里面是晨曦觉得写的很出色的教程,各位小伙伴也可以按需读取

我是晨曦火币pro官网下载,我们下期再见~

参考资料:

1.官网教程:/

2.更新:/

— END—

撰文丨晨 曦

排版丨三叶虫

编辑丨三叶虫

欢迎大家关注解螺旋生信频道-挑圈联靠公号~

评论