找回密码
 加入慢享
猜你喜欢
旅行常客论坛

自行构建CDF包解决读取CEL文件报错

[复制链接]
发表于 2022-9-30 19:00:00 | 显示全部楼层 |阅读模式

点击蓝字 / 关注我们

遇到问题

在读取GEO数据库的CEL文件时,出现了报错,无法找到包pd.hursta.2a520709,命令如下:

rm(list=ls());gc();setwd("C:/22SHB021F/")library(GEOquery)library(affyPLM)library(affy)library(oligo)gse="GSE72094_RAW"baseDir <- "C:/22SHB021F/"workDir <- file.path(baseDir, gse)celfiles <- list.files(workDir, "\\.CEL$")  # 匹配以.CEL 结尾的文件。data.raw <- read.celfiles(filenames = file.path(workDir, celfiles))

因为之前别的数据集是正常读取的,而按照通常的解决思路的话,直接把这个包安装上即可。没怎么想就用BiocManager试了下

BiocManager::install("pd.hursta.2a520709")

结果BiocManager并不存在这个包。

后经搜索引擎查找发现需要自己创建这个包,这类包是CDF包,开始操作

构建CDF包

查找GSE72094_series_matrix.txt文件发现测序芯片为GPL15048


进入GEO数据库,

下载CDF文件

https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GPL15048


下载第一个

使用makecdfenv包创建CDF包pd.hursta.2a520709,代码如下

BiocManager::install('makecdfenv')library(makecdfenv)make.cdf.package("GPL15048_HuRSTA_2a520709.CDF.gz", "pd.hursta.2a520709",                  species = "Homo sapiens", compress = TRUE)install.packages("pd.hursta.2a520709", repos =  NULL, type="source" )

再次读取GEO数据库的CEL文件,就可以正常运行了。

兜兜转转终于把问题解决了,希望小云能帮大家少走弯路。

往期

推荐


 生信实操 

  生信软件 

 生信数据库 

生信入门

  代码  

小云解读生信图

双疾病分析

单基因分析

  铁死亡 

服务项目


生信热点文献复现

临床预后模型设计

生信&实验方案设计

数据库构建

共享1T生信服务器

35篇原创代码合集

示例报告


单基因在肿瘤中的生信分析

疾病药物代谢相关基因与肿瘤免疫、预后关系探讨

糖尿病周围神经病变铁死亡相关的基因分析

     

我知道你在看

回复

使用道具 举报

快速回复 返回顶部 返回列表