R|解决100个常见生信小问题（1-5）

来源: https://www.yuque.com/docs/share/f52fe166-d1f4-469a-8a4a-7d1a05567fc5?# 发布: 2020-04-15 7,985阅读 107评论

前言：昨晚听了师兄开的博客熊言熊语，印象最深的Jimmy, 以及徐洲更，果子的两期，顺带做了一枚DIY的发卡。除去Jimmy的有趣经历，印象最深的就是两期里都提到的，要以任务为导向去学习编程。我的师姐们也想学习编程，因此我想给她们整理一些小任务，帮助她们更好地入门R。我也不知道能不能坚持到整理出100个，只希望师姐们不会催我。

1. 基因ID转换（Gene ID Conversion）

首先来看看下面这串基因ID，你认识吗？

TP53

P53

BCC7

LFS1

BMFS5

TRP53

ENSG00000141510

7157

但是如果我告诉你这些都是同一个基因，你会惊讶吗？但是其实这里面只包含来三种Gene ID类型，第一个是SYMBOL（），第二个到第六个是它的别名，ENS开头的是ENSEMBL ID, 最后那个纯数字的是ENTREZ ID（目前国际上最权威的Gene ID编号）。

TP53（SYMBOL）

ENSG00000141510（ENSEMBL）

7157（ENTREZ）

不同数据库来源有不同的Gene ID，你是不是要疯了呢？但是，远不止这些。此外，还有Uniprot， HGNC等等类型（其他的用得很少，请自行了解，一般就是上面提到的三种之间互相转换）。

背景知识讲完了，下面我们来开始做任务了。

这里需要用到Y叔的clusterProfiler和相应的物种注释包（human:org.Hs.eg.db; mouse: org.Mm.eg.db）。

由于这些包都在Bioconductor上（Bioconductor是基因组数据分析相关的软件包仓库，也有的会提交到CRAN上），无法用install.packages()安装，所以用Bioconductor官方的安装方法即可。

# 安装相应的包
if (!requireNamespace("BiocManager", quietly = TRUE))
  install.packages("BiocManager")
BiocManager::install("org.Hs.eg.db")
BiocManager::install("clusterProfiler")

安装tips：

安装时发现直接运行上面的命令无法顺利安装。需要先安装Rcpp，GO.db, DO.db。故可先运行下面的命令。

install.packages("Rcpp")
if (!requireNamespace("BiocManager", quietly = TRUE))
  install.packages("BiocManager")
BiocManager::install("GO.db")
BiocManager::install("DO.db")

这里需要使用clusterProfiler的bitr函数转换基因ID，需要调用标准注释库org.db类型的org.Hs.eg.db（包含了各色基因ID信息）

# 加载包
library("clusterProfiler")
library("org.Hs.eg.db")

genelist1 <- c("TP53", "YY1","DNMT1","SOX7","CTCF","KLF4")
               
genelist2 <- bitr(genelist1, fromType = "SYMBOL", toType = "ENTREZID", org.Hs.eg.db)

genelist2

运行结果：

再看看下面这个代码的输出和上面的有什么区别？

# 加载包
library("clusterProfiler")
library("org.Hs.eg.db")

genelist1 <- c("TP53", "YY1","DNMT1","SOX7","CTCF","KLF4","P53")
               
genelist2 <- bitr(genelist1, fromType = "SYMBOL", toType = "ENTREZID", org.Hs.eg.db)

genelist2

为什么出现了Warning呢？这是因为后面加的P53和TP53是同一个基因，而且SYMBOL格式的是TP53，P53就不被识别了。

如有错误，敬请指正。

2. 数据分类（within）

第二个问题是这样的，有这样一个数据表（data frame）expn, 第一列是genename，第二列是表达水平值，实际数据分析中，我们要面对的可能是几千甚至几万个基因，表达水平也有很多形式，这里只是创建了一个很简单的小数据表。

expn <- data.frame(genename=c("TP53", "YY1","DNMT1","SOX7","CTCF","KLF4"),exp=c(50,200,35,300,80,90))
expn

输出：这就是我们的要用来操作的数据表了。

##   genename exp
## 1     TP53  50
## 2      YY1 200
## 3    DNMT1  35
## 4     SOX7 300
## 5     CTCF  80
## 6     KLF4  90

以50和100为阈值，划分高中低表达组，并新建一列保存结果。

expn.new <- within(expn,{
                   Type <- NA
                   Type[expn$exp >= 100] <- "High"
                   Type[expn$exp < 100 & expn$exp > 50] <- "Medium"
                   Type[expn$exp <= 50] <- "Low"
                   })
expn.new

输出：

##   genename exp   Type
## 1     TP53  50    Low
## 2      YY1 200   High
## 3    DNMT1  35    Low
## 4     SOX7 300   High
## 5     CTCF  80 Medium
## 6     KLF4  90 Medium

数据分类在实际数据分析中很常见，如画图的时候需要根据不同类别标记不同的颜色。

3.如何对多个重复的表达值求均值？（行操作：rowMeans, rowSums）

第二个问题中数据表只有一个表达值，实际中我们会遇到重复，那么如何应对有重复值的数据呢，那就是要求均值了。一般情况下，

expn <- data.frame(genename=c("TP53", "YY1","DNMT1","SOX7","CTCF","KLF4"),rp1=c(50,200,35,300,80,90),rp2=c(45,210,40,290,85,88),rp3=c(52,205,39,309,87,93))
expn

输出：使用的数据表

##   genename rp1 rp2 rp3
## 1     TP53  50  45  52
## 2      YY1 200 210 205
## 3    DNMT1  35  40  39
## 4     SOX7 300 290 309
## 5     CTCF  80  85  87
## 6     KLF4  90  88  93

查看2-4列，即我们要求均值的数据。

expn[2:4]

输出：

##   rp1 rp2 rp3
## 1  50  45  52
## 2 200 210 205
## 3  35  40  39
## 4 300 290 309
## 5  80  85  87
## 6  90  88  93

求均值：

expn$Mean <- rowMeans(expn[2:4])
expn

##   genename rp1 rp2 rp3      Mean
## 1     TP53  50  45  52  49.00000
## 2      YY1 200 210 205 205.00000
## 3    DNMT1  35  40  39  38.00000
## 4     SOX7 300 290 309 299.66667
## 5     CTCF  80  85  87  84.00000
## 6     KLF4  90  88  93  90.33333

表达谱不会需要求和的，但是我懒得再创建新的数据表了，将就着练习吧。

对2-4列数据求和：

expn$Sum <- rowSums(expn[2:4])
expn

##   genename rp1 rp2 rp3      Mean Sum
## 1     TP53  50  45  52  49.00000 147
## 2      YY1 200 210 205 205.00000 615
## 3    DNMT1  35  40  39  38.00000 114
## 4     SOX7 300 290 309 299.66667 899
## 5     CTCF  80  85  87  84.00000 252
## 6     KLF4  90  88  93  90.33333 271

目前提到了rowMeans, rowSums，其实还有colMeans, colSums，不是经常会用到，自己去看吧。

4. 我们来写个for loop吧

第三个问题中提到了求均值，但是实际中往往还需要求标准差（Standard Error, SD）。在R语言中，求SD的函数就是sd()。这里和第三个问题一样，需要创建一个小的数据表。

expn <- data.frame(genename=c("TP53", "YY1","DNMT1","SOX7","CTCF","KLF4"),rp1=c(50,200,35,300,80,90),rp2=c(45,210,40,290,85,88),rp3=c(52,205,39,309,87,93))
expn

输出：

##   genename rp1 rp2 rp3
## 1     TP53  50  45  52
## 2      YY1 200 210 205
## 3    DNMT1  35  40  39
## 4     SOX7 300 290 309
## 5     CTCF  80  85  87
## 6     KLF4  90  88  93

这里涉及到行名的问题。创建data.frame的时候命名了列名，但是没有命名行名，这里使用rownames()进行命名，把genename作为行名（需要注意的是，用于行名的数据不允许出现重复值）。然后新加了SD列，并填充空值（NA）。

然后就是for循环对每个基因的三个重复（2-4列）的表达值求SD，并加到SD列中。

rownames(expn) <- expn$genename
expn$SD <- NA
for(i in rownames(expn)){
  expn[i,]$SD <- sd(expn[i,2:4])
}
expn

输出：如果想比较一下，可以在for loop前打印一下expn，可以看到SD列都是NA。

##       genename rp1 rp2 rp3       SD
## TP53      TP53  50  45  52 3.605551
## YY1        YY1 200 210 205 5.000000
## DNMT1    DNMT1  35  40  39 2.645751
## SOX7      SOX7 300 290 309 9.504385
## CTCF      CTCF  80  85  87 3.605551
## KLF4      KLF4  90  88  93 2.516611

一个简单的for loop就是长这样了。

5. 再来看看if else吧

第五个问题是用for loop套if else结构实现第二问中的效果。

创建和第二问中相同的data.frame。

expn <- data.frame(genename=c("TP53", "YY1","DNMT1","SOX7","CTCF","KLF4"),exp=c(50,200,35,300,80,90))
expn

输出：

##   genename exp
## 1     TP53  50
## 2      YY1 200
## 3    DNMT1  35
## 4     SOX7 300
## 5     CTCF  80
## 6     KLF4  90

然后就是一样的，先写一个for loop，再来写if else。下面涉及的if…else if …else是if...else if...else语句的基本语法结构，这只是if else中的一种形式，也是我们分析中最常需要的一种。

rownames(expn) <- expn$genename
expn$Type <- NA
for(i in rownames(expn)){
  if(expn[i,]$exp >= 100){
    expn[i,]$Type <- "High"
  } else if(expn[i,]$exp <= 50){
    expn[i,]$Type <- "Low"
  } else{
    expn[i,]$Type <- "Medium"
  }
}
expn

输出：结果和第二问中一致。

##       genename exp   Type
## TP53      TP53  50    Low
## YY1        YY1 200   High
## DNMT1    DNMT1  35    Low
## SOX7      SOX7 300   High
## CTCF      CTCF  80 Medium
## KLF4      KLF4  90 Medium

如果想要阅读更舒服，可前往语雀原文链接：https://www.yuque.com/docs/share/f52fe166-d1f4-469a-8a4a-7d1a05567fc5?#

731赞

发表回复取消回复

评论列表(107)

Wyyebo说道：

2025-04-19 14:21

purchase coumadin pills – buy generic cozaar buy cozaar 50mg generic

回复
Cumyjk说道：

2025-03-11 18:00

cenforce 100mg us – metformin 500mg brand metformin 500mg brand

回复
Frfwgj说道：

2025-03-04 17:21

viagra 100mg generic – buy viagra 50mg sale cialis 10mg

回复
Bpyplu说道：

2025-03-04 07:36

buy cialis 40mg without prescription – cialis super active buy sildenafil pill

回复
Ablpmm说道：

2025-02-24 02:07

purchase rybelsus for sale – rybelsus 14mg sale buy periactin 4mg for sale

回复
Lbclnu说道：

2025-02-22 05:03

oral augmentin 625mg – buy amoxiclav for sale duloxetine pill

回复
Zbkxbc说道：

2024-12-02 07:32

eriacta mile – zenegra online guy forzest until

回复
Ibfjxk说道：

2024-11-21 07:54

гѓђг‚¤г‚ўг‚°гѓ©е‡¦ж–№ – г‚·гѓ«гѓ‡гѓЉгѓ•г‚Јгѓ« и–¬е±ЂгЃ§иІ·гЃ€г‚‹ г‚·г‚ўгѓЄг‚№гЃ®йЈІгЃїж–№гЃЁеЉ№жћњ

回复
Retqix说道：

2024-10-23 10:36

where can i buy provigil – generic provigil cost melatonin

回复
Aykoks说道：

2024-10-19 11:19

clindamycin price – cleocin 300mg tablet indocin 75mg generic

回复
Qpemcw说道：

2024-10-18 00:13

generic hyzaar – keflex online order cephalexin price

回复
Lgwrpr说道：

2024-10-13 08:20

augmentin 1000mg ca – oral synthroid cost synthroid

回复
Okezpn说道：

2024-10-12 07:05

buy cheap generic flagyl – buy metronidazole 400mg pill cenforce 50mg pill

回复
Dgbtzt说道：

2024-10-07 15:18

buy generic permethrin – how to buy benzac tretinoin gel canada

回复
Awkprg说道：

2024-10-02 16:59

order isotretinoin pills – isotretinoin 10mg oral deltasone 10mg oral

回复
Tjiuah说道：

2024-10-01 23:26

prednisone order online – deltasone 20mg oral how to buy permethrin

回复
Licshf说道：

2024-09-27 16:09

how to buy trihexyphenidyl – purchase trihexyphenidyl for sale buy diclofenac gel online

回复
Yvdrod说道：

2024-09-25 02:15

omnicef 300mg price – buy cleocin

回复
Nmjwgd说道：

2024-09-21 20:50

mobic 15mg ca – mobic over the counter buy toradol online

回复
Fbuxqg说道：

2024-09-19 02:30

order cyproheptadine online cheap – periactin drug tizanidine drug

回复
Udcjub说道：

2024-09-16 00:27

buy voveran online cheap – buy imdur where can i buy nimotop

回复
Ujryvq说道：

2024-09-13 13:22

baclofen generic – buy baclofen 25mg sale feldene tablet

回复
Avmnxt说道：

2024-09-09 02:18

rumalaya brand – buy elavil paypal elavil 50mg generic

回复
Opdcqp说道：

2024-09-07 14:25

mestinon brand – purchase mestinon buy azathioprine 50mg online

回复
Tykdmt说道：

2024-08-31 03:32

colospa cheap – buy generic mebeverine for sale generic cilostazol

回复
Xxmfwz说道：

2024-08-30 17:02

voltaren 100mg canada – order aspirin pill buy generic aspirin

回复
Orzvof说道：

2024-08-20 12:27

order neurontin 800mg generic – order neurontin 100mg pill sulfasalazine where to buy

回复
Eqmiar说道：

2024-08-16 14:30

buy cheap generic deflazacort – alphagan order purchase brimonidine online

回复
Cbadyg说道：

2024-08-12 13:21

purchase imusporin generic – cyclosporine online order colcrys ca

回复
Xzhmpx说道：

2024-08-08 05:54

lactulose price – buy mentat pills for sale betahistine pills

回复
Mwmcmt说道：

2024-08-06 11:31

trileptal 600mg pill – order pirfenex for sale order synthroid 100mcg generic

回复
Suxwft说道：

2024-08-02 01:54

buy hytrin sale – buy tamsulosin without a prescription purchase dapoxetine online

回复
Eqtvkv说道：

2024-07-28 16:09

order generic finax – uroxatral drug uroxatral without prescription

回复
Khnttz说道：

2024-07-24 07:26

cheap speman pills – cheap fincar pill buy finasteride

回复
Qwppzh说道：

2024-07-24 01:26

how to buy noroxin – where can i buy confido buy cheap generic confido

回复
Zxfqdn说道：

2024-07-20 21:52

buy lasuna medication – diarex pills buy generic himcolin

回复
Ggbghd说道：

2024-07-16 15:41

purchase calan without prescription – calan pills buy tenoretic generic

回复
Fracpu说道：

2024-07-16 10:30

atenolol 100mg generic – betapace 40mg over the counter buy carvedilol without prescription

回复
Gvabsk说道：

2024-07-14 12:05

cheap arava – alfacalcidol cost purchase cartidin pills

回复
Qctlfx说道：

2024-07-14 00:12

rogaine canada – cheap finpecia generic proscar 5mg cheap

回复
Ugilkx说道：

2024-07-08 23:10

buy ascorbic acid 500mg without prescription – buy generic isordil online buy generic prochlorperazine online

回复
Jfrzsk说道：

2024-07-07 11:07

order ondansetron online – order oxybutynin online cheap buy requip 1mg sale

回复
Iaikwo说道：

2024-07-06 16:12

order cyclobenzaprine 15mg generic – order zyprexa pill vasotec 10mg brand

回复
Ainkvk说道：

2024-07-03 01:13

order spironolactone without prescription – buy prothiaden paypal order naltrexone 50 mg online

回复
Mveokd说道：

2024-07-02 12:02

cyclophosphamide generic – antivert 25 mg pill buy vastarel pill

回复
Nreobf说道：

2024-06-25 18:57

piracetam 800 mg oral – sinemet cost buy sinemet generic

回复
Pwcurp说道：

2024-06-15 21:27

piroxicam 20mg canada – order piroxicam 20mg for sale exelon 3mg us

回复
Fgymct说道：

2024-06-15 16:06

purchase monograph online – generic pletal 100mg order cilostazol 100 mg pills

回复
Wzuaih说道：

2024-06-13 16:48

dramamine 50mg uk – dimenhydrinate 50mg us actonel generic

回复
Dfodcl说道：

2024-06-13 11:33

buy vasotec 10mg online – doxazosin cheap zovirax without prescription

回复
Etkafo说道：

2024-06-11 17:06

buy fulvicin 250 mg sale – cost griseofulvin 250 mg generic lopid 300mg

回复
Xrdepe说道：

2024-06-11 01:40

buy forxiga 10 mg pills – buy acarbose without a prescription generic precose 50mg

回复
Jroptc说道：

2024-06-09 16:44

hydroquinone canada – dydrogesterone without prescription buy duphaston 10mg sale

回复
Crkdik说道：

2024-06-08 23:14

cotrimoxazole pill – buy bactrim 480mg for sale oral tobramycin 5mg

回复
Dguzkf说道：

2024-06-06 18:38

order aciphex sale – maxolon brand buy motilium for sale

回复
Nhrmcv说道：

2024-06-02 07:06

florinef pills follow – esomeprazole pills choice lansoprazole anymore

回复
Efjhae说道：

2024-06-01 21:18

clarithromycin pills anxious – clarithromycin pills mention cytotec blanket

回复
Ugdzpv说道：

2024-05-30 21:16

ascorbic acid weapon – ascorbic acid thrust ascorbic acid newspaper

回复
Gzvmmy说道：

2024-05-27 10:52

dapoxetine craft – dapoxetine together priligy huddle

回复
Sowvaw说道：

2024-05-27 07:02

claritin pills telephone – claritin pills boy claritin pills lest

回复
Ggbuhj说道：

2024-05-23 19:52

valtrex pills native – valacyclovir pills obtain valacyclovir online improve

回复
Yuqnnl说道：

2024-05-22 09:08

prostatitis pills level – pills for treat prostatitis relative prostatitis medications stre

回复
Wyriyf说道：

2024-05-20 12:09

inhalers for asthma weak – asthma medication people asthma medication notion

回复
Xhjbfh说道：

2024-05-20 00:44

acne treatment bile – acne treatment alice acne treatment doubtful

回复
Kwfeoi说道：

2024-05-18 20:56

priligy taste – cialis with dapoxetine themself cialis with dapoxetine heap

回复
Jnjvix说道：

2024-05-18 06:02

cenforce online wake – levitra professional pills below brand viagra mess

回复
Rzdphf说道：

2024-05-14 05:52

cialis soft tabs online explosion – tadarise pills record viagra oral jelly online spite

回复
Cktepw说道：

2024-05-12 00:59

brand cialis dim – alprostadil furious penisole need

回复
Gdtwhx说道：

2024-05-11 09:38

cialis soft tabs pills sacrifice – cialis soft tabs pills wither viagra oral jelly disappointment

回复
Osbhbh说道：

2024-05-09 12:29

brand cialis joe – forzest nearby penisole opposite

回复
Egewsx说道：

2024-05-06 21:15

dapoxetine important – aurogra sensation cialis with dapoxetine university

回复
Zfblpr说道：

2024-05-05 09:13

buy viagra professional supple – avana operation levitra oral jelly broomstick

回复
Vjqlid说道：

2024-05-03 02:45

crestor cunning – zetia shiver caduet pills meet

回复
Mwryxy说道：

2024-05-02 15:09

simvastatin atmosphere – lopid gallop lipitor carter

回复
Sqomte说道：

2024-04-30 10:48

buy nitroglycerin online cheap – buy indapamide 1.5mg without prescription buy diovan 160mg

回复
Pgubyt说道：

2024-04-28 21:52

buy lopressor generic – order micardis 20mg adalat 30mg pills

回复
Nxpyxg说道：

2024-04-28 10:39

oral hydrochlorothiazide 25 mg – felodipine 5mg price bisoprolol 5mg canada

回复
Dbhfbj说道：

2024-04-26 08:40

purchase lanoxin generic – buy furosemide sale how to get lasix without a prescription

回复
Xerxsc说道：

2024-04-24 07:09

buy ketoconazole 200mg pill – generic nizoral 200mg itraconazole 100 mg oral

回复
Ixonrt说道：

2024-04-22 17:02

order rybelsus 14 mg for sale – order desmopressin online DDAVP medication

回复
Rmzeao说道：

2024-04-22 03:54

buy terbinafine 250mg – griseofulvin 250mg generic griseofulvin brand

回复
Qjoqhn说道：

2024-04-19 10:30

buy cheap generic repaglinide – buy repaglinide online empagliflozin 10mg pill

回复
Adwdvy说道：

2024-04-17 10:43

order micronase generic – generic forxiga 10mg order forxiga 10mg without prescription

回复
Thuyvv说道：

2024-04-15 13:57

methylprednisolone 16mg over counter – buy generic fml-forte buy azelastine 10 ml without prescription

回复
Fthaii说道：

2024-04-15 09:34

buy clarinex 5mg – ketotifen 1mg drug ventolin 2mg canada

回复
Jgjdru说道：

2024-04-13 00:23

ventolin over the counter – buy theo-24 Cr 400 mg online buy theophylline 400mg

回复
Myefhe说道：

2024-04-12 13:54

ivermectin 6 mg without a doctor prescription – doryx usa buy cefaclor 500mg capsules

回复
Exjepm说道：

2024-04-09 21:04

azithromycin generic – ciprofloxacin online buy where to buy ciprofloxacin without a prescription

回复
Hjlxcr说道：

2024-04-09 09:27

buy clindamycin online – cleocin 300mg brand chloramphenicol for sale online

回复
Bwlcxa说道：

2024-04-04 01:20

amoxicillin order – buy cheap generic amoxil buy generic ciprofloxacin

回复
Tgxetg说道：

2024-04-03 22:23

buy augmentin no prescription – augmentin 625mg price order ciprofloxacin 500mg for sale

回复
Sjnldt说道：

2024-03-31 10:55

oral atarax – order atarax 25mg generic endep 25mg brand

回复
Mnyrfz说道：

2024-03-30 20:06

order clomipramine 25mg sale – purchase amoxapine buy sinequan cheap

回复
Iqmkvi说道：

2024-03-29 09:41

buy generic quetiapine – order desyrel generic purchase eskalith generic

回复
Zpyznz说道：

2024-03-28 04:10

clozapine 50mg oral – order frumil 5mg online famotidine 20mg without prescription

回复
Tsvvyf说道：

2024-03-26 10:53

zidovudine 300 mg oral – allopurinol 100mg generic zyloprim where to buy

回复
Auqdca说道：

2024-03-25 18:54

order glucophage 500mg for sale – oral sulfamethoxazole lincocin 500 mg pills

回复
Enekoi说道：

2024-03-23 05:16

lasix 100mg cheap – captopril 25 mg without prescription buy capoten medication

回复
Qyxwqe说道：

2024-03-21 23:44

cheap ampicillin penicillin brand amoxicillin pill

回复
Zrxjzu说道：

2024-03-21 17:51

order flagyl 200mg for sale – zithromax ca zithromax 500mg oral

回复
Gkvdwl说道：

2024-03-19 22:29

ivermectin 12mg tablets – cheap axetil order tetracycline 500mg generic

回复
Pzgvfr说道：

2024-03-19 11:40

valacyclovir 500mg drug – valtrex online order buy zovirax online

回复
Lmmwxp说道：

2024-03-17 18:39

buy ciprofloxacin generic – erythromycin 250mg uk buy erythromycin 250mg pills

回复
Mtjkmn说道：

2024-03-17 07:04

metronidazole 400mg drug – buy zithromax paypal order azithromycin 250mg generic

回复
Yqgruj说道：

2024-03-14 14:44

ciprofloxacin 500mg sale – augmentin order augmentin 375mg cost

回复
Qaexmw说道：

2024-03-14 11:32

where to buy cipro without a prescription – order keflex generic buy augmentin pill

回复
Iwjeev说道：

2024-03-13 02:16

atorvastatin 80mg generic buy atorvastatin generic lipitor for sale online

回复