您的位置 首页 工具使用

【实用干货】如何上传数据至NCBI?

高通量测序结束之后,想要发表文章,除了要面对数据分析这一难题,还需要将测序数据上传至NCBI。

上传到NCBI 的数据可归纳为两大类:测序原始数据和分析数据。原始数据(Raw data)指测序下机的最初文件,未经任何处理和分析;金唯智所提供的是 Illumina 机器产生的fastq文件。这一类型的文件需要向 NCBI 的 SRA(Sequence Read Archive) 数据库进行提交,提交操作步骤相对比较简单。

分析数据提交根据不同的项目类型需要向不同的数据库提交不同的分析结果。NCBI 提交不同数据对应数据库和提交的方法,可参照链接:http://www.ncbi.nlm.nih.gov/guide/howto/submit-sequence-data/

不同的数据类型需要上传的数据库可参照下表:

下面就针对最常见的SRA数据上传为大家进行详细介绍。

1. 注册自己的NCBI帐号

打开下方链接

https://www.ncbi.nlm.nih.gov/account/

点击图中标注的“ Register for a NCBI account”,进入到注册页面,如实填写信息。

2. 完成注册,开始上传数据

不管提交什么数据到 NCBI,都需要对这份数据进行一个描述,包括前期项目情况、样本属性及制备情况等;BioProject和BioSample 即描述研究项目的、研究背景、材料属性等基本信息。

一个BioProject 代表一项测序研究项目,可包含多个BioSample,也可以包含多次实验experiments,所以在提交数据前,先申请 BioProject 号和BioSample 号。通常 BioSample 号以SAMN 开头,如 SAMN*****;BioProject 号以 PRJNA 开头,如 PRJNA*****。这两个号需要在后续SRA 提交过程中使用。

(1)创建BioProject

登陆下方链接,创建 New submission:

https://submit.ncbi.nlm.nih.gov/subs/bioproject/

或登录NCBI 之后点击页面左下角Submit Data,在Quick Start 里面选择BioProject,然后点击GO 。

① SUBMITTER:根据研究项目实际情况,填写一系列的信息,每填写完一个步骤,都要点击页面下方的continue,保存已填写的信息。

注意:email选项中,两个邮箱中要留一个该测序项目负责人的常用邮箱,因为后期如果想要修改数据信息或者释放时间,都需要该邮箱发送邮件到NCBI才会被受理。

② PROJECT TYPE

● 根据自己的项目类型选择Project Type,一般高通量测序数据可选择“Raw sequence reads”。
● Sample scope:是对实验物种的简洁描述或者说是一个题目,根据不同选择会影响后面TARGET的填写。

③ TARGET

④ GENERAL INFO:基本信息填写
● Release data:这个就是您的数据公开日期,可以点击立即释放,也可以选择具体时间
● Project title:根据TARGET 提供一个简短的标题,如:
1) Chromosome Y sequencing
2) Opportunistic pathogen that causes important food-born disease
3) Global studies of microbial diversity on human skin
注意:红框中要选择是否关联其他数据,若选择“No”则红框中的内容不进行填写;选择“Yes”,红框中的内容为必填项。

⑤ Biosample:写上样品名称即可,注意需要与之后创建 Biosample 时的样品名称一致。

如果只有一个样品,可以点击“register at Biosample”进行样品注册,样品注册完成后会自动调回BioProject 注册界面。但是如果您有多个样品,可以直接点击“Continue”,完成BioProject 注册后再进行BioSample 注册。

⑥ PUBLICATIONS:填写PubMed ID 或DOI 号

注:BioSample 和Publications 这两步可以省略,后期发邮件给e-mail 给NCBI 进行修改。

确认无误后,点击“Submit”按钮,创建该Project。经过以上步骤,经过批准会发送到邮箱里面,获得以 PRJNA 开头的BioProject ID。

(2)创建 BioSample

与创建BioProject相同,登录https://submit.ncbi.nlm.nih.gov/subs/biosample/,点击“New submission”;或登录NCBI 之后点击页面左下角Submit Data,在Quick Start里面选择BioSample,然后点击GO 。

同样是根据研究项目实际情况,填写信息;每填写完一步,都要点击页面下方的continue,保存已填写的信息。

① Submitter:填写个人基本信息,如果已经成功提交BioProject 会自动填补,无需修改。

② General Information:Release data,该信息与BioProject 类似,数据释放时间;选择样本类型,是选择多样本还是单样本上传。

③ SAMPLE TYPE:根据实际情况选择。

④ ATTIBUTES:

在这有两种上传数据方式,点击“Use built-in tableeditor”,可在此直接进行编辑。

也可根据提示下载excel后填写。

表格中的绿色是必填项,一定要保证至少一个因子可以区分各个样本(名字除外)。可参考下方链接:
https://submit.ncbi.nlm.nih.gov/biosample/template/?package=Microbe.1.0&action=definition

a. sample_name:样品名;
b. sample_title:每个处理可以写一个题目,可选;
c. description:处理的描述,可选;
d. organism:优势物种名;
e. collection_date:采样时间,如:2012-08-16;
f. geo_loc_name:采样地,如:China:Beijing;
g. lat_lon:经纬度,如:39 N 116 E;
h. isolation_source:分离环境,如:Rhizosphere soil;

注意:表格提交后,一定要保证没有任何warnings,不然即使提交上去也不会通过,如果爆出“Warn”信息,则需要等待2 个工作日方能重新进行该步骤。

确认无误后,点击最后的“Submit”按钮。经过以上步骤,邮箱会收到以 SAMN 开头的BioSample ID。

3. 提交SRA

直接登录网址,创建 New submission。
https://submit.ncbi.nlm.nih.gov/subs/sra/

(1)Submitter :同样是填写个人基本信息,如果已经成功提交BioProject 会自动填补,无需修改。

(2)General:将上述创建的BioProject和BioSample ID直接引用就可以。此外还需要设置Release data,数据的释放时间一般尽可能选择文章发表之后,后续也可以根据实际需要进行更改。

(3)Metadata:可选择在线填写或者下载Excel表格填写后上传。其中BioProject 、BioSample的登陆号PRJNA#和SAMN# 是必填的。

表格中需填写的内容如下:
a. library_strategy:测序策略,如AMPLICON;
b. library_source:材料来源,如GENOMIC;
c. library_selection:富集方法,如PCR;
d. library_layout:展示形式,如Paired、Fragment;
e. platform: 测序平台,如下图;
f. instrument_model:测序仪器型号,根据测序平台选择;
g. Filetype: 上传数据形式,如bam、fastq、PacBio_HDF5 等。

(4)数据上传:完成以上内容后,即可进行最重要的一步,也就是数据上传。

如果数据量比较小,可以使用在线方式上传:

对于数据量较大的项目,可以使用NCBI的Aspera软件,详细参见链接:
https://www.ncbi.nlm.nih.gov/sra/docs/submitfiles/

(5)确认无误,点击“Submit”

邮箱中会收到相应的Accession number 的登录号(SRR*****或者SRA*******),用于查询和检索。

上传任务完成后,会有Status 状态栏,专门用于提示提交状态以及可跟踪查询的可视化表现形式。

完成(Done)土黄色代表已经完成的目标数字。
等候(Wait)灰色需要更多的信息及文件加载。
处理中(Processing)浅蓝色代表目标正在处理中,如果一个目标或者文件处理的时间超过48小时,可联系SAR(sra@ncbi.nlm.nih.gov)。
队列(Queue)深蓝色是当传递途径可用时,目标便会被正在处理。
更换(Replaced)鲜绿色是当一个目标或者文件被另一个更换。错误(Error)红色需要介入调停,请联系SRA。
数据上传中如果出现问题,邮件联系NCBI就会收到热心的解答。

若您在NGS项目中有其他问题,可以拨打电话400-8100-669选项3,或发送邮件至NGS.Service@genewiz.com.cn,我们将在第一时间内为您提供咨询服务。

作者: GENEWIZ金唯智

GENEWIZ(金唯智)成立于1999年,总部位于美国新泽西州,是专注于基因组研究和基因技术应用的生物高科技公司。金唯智在全球范围内为科学研究人员提供高通量测序、Sanger测序、基因合成、引物合成、分子生物学服务及GLP标准规范服务。基于金唯智严谨的科学和卓越的服务,包括近30位诺贝尔奖获得者在内的众多科研工作者已成为金唯智的忠实客户,全球诸多知名跨国公司以及著名高等学府也把金唯智选为其战略合作伙伴和首选供应商



发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注

评论列表(86)

  1. 版本设置● 服务器是仿标准6.0设置。● 基础经验是5倍,限制12开,有挂,长久耐玩。● 有经验果实加成,保证升级不慢。● 活力系统,五转人物每5分钟可得1点活力,副本任务可以获得大量活力。● 本服坐骑有6.0官方坐骑,还有自创家族坐骑。● 本服有在线红包系统,系统自动发放20-50会员点不等的拼手气红包。● 本服设置玩家PK擂台,让PK不仅仅获得DP,还可以获得点卷,活力,声望。● 开放家族最大上限100人,家族竞争多。● 开放四大庄园 萨姆吉尔、玛丽娜斯、卡鲁它那、加加庄园。● 目前下书为当日下,第二日族战,更人性化设计。● 声望:主要靠练级得到,做任务和游戏中也可得到不少声望。● 石币:

  2. 本服是1.996微变版本.是一个决不厌烦的传世版本.采用了各种精华组合在一起的长久服.GM绝不参与游戏和任何一个活动.所有的一切活动都是靠玩家自己争取获得.全国独家,激情无限,免费泡点地图站着不动长元宝,装备回收,装备合成.让你元宝用不完!本服所有的装备合成都是在游戏里面的NPC装备合成炉合成..各大地图狂爆装备.顶级的斗魂套随便都可以合上哦.只要您有时间,一切不是梦想.新增丰富的冲级奖励,鼓励玩家练级(详情查看老兵)新区沙城奖励为五千万元宝,不要担心无GM联系不到客服,半小时之内会自动发放元宝奖励到沙城主号里!本服永久开放,公平公正!凡是担心内服黑服的家族及玩家请退离此服!!优化了全部场景地

  3. Barley beta glucan lowers serum cholesterol based on the up regulation of cholesterol 7alpha hydroxylase activity and mRNA abundance in cholesterol fed rats cheap generic cialis

  4. 游戏基本设置说明 (封闭一切外挂辅助) 本服物理3+105满、法师95左右满,装备10改满、机械4改满 (封闭一切外挂辅助) 设置160级满级 开放罗地图为主城市。封掉了脱机练级挂、加速挂、纯绿色手动4.0! 开放了机械、锆石、必杀、守护、百级装备,开放机械4改满。 法师职业96左右释放大抽 魔抗不转魔攻 各职业平衡 请放心选择 武器装备前3改99%不爆 传送门不掉耐久 玩家被怪物攻击死不掉经验 在城内不消耗兴奋 幸运 游戏里的SHOP键 或/我时间 的可以查询剩余的:兴奋、幸运、幸福时光,等等个人的信息状态 游戏最高掉装备属性: 50生命10回25抗5力/敏等 属性不重复

  5. The most talked about weight loss product is finally here! FitSpresso is a powerful supplement that supports healthy weight loss the natural way. Clinically studied ingredients work synergistically to support healthy fat burning, increase metabolism and maintain long lasting weight loss. https://fitspresso-try.com/

  6. 有个东西,左看像电灯,右看也像电灯,和电灯没什么两样。但它就是不会亮,?是啥东西呢?它是坏电灯。很喜欢您的文章

  7. 买东西最恐怖的是:你战战兢兢说了个价,老板难为了一下就瞬间答应了。。。真心谢谢博主。很喜欢您的文章

  8. 楼主辛苦感谢您。by 公需课找代学网https://www.zhaodaixue.com

联系我们

联系我们

(44)07934433023

在线咨询: QQ交谈

邮箱: info@bioengx.org

关注微信
微信扫一扫关注我们

微信扫一扫关注我们

关注微博
返回顶部