数据集的构建¶
1、登录服务器¶
下载MobaXterm便携版官网,打开后点击 Session→SSH,输入以下信息完成SSH连接的创建,后续双击连接,输入密码即可登录。 文档以动科账号为例,动科和动医账号信息如下:
-
动科
remote host:211.69.141.149
username:dongkeai
passwd:dongkeai上课日期4位数字
port:2018
-
动医
remote host:211.69.141.149
username:dongyiai
passwd:dongyiai上课日期4位数字
port:2018
Note
也可以选用系统自带的终端工具或者其他第三方终端工具,这里使用MobaXterm主要是其具有较高的集成度。
进入命令界面后输入下列命令进入工作目录(如果登录失败 Network error: Connection refused可以按 R再次尝试),弹出密码输入框就意味着部署成功了
#利用ssh登录到测试服务器
ssh fat01
#利用 cd 命令切换到工作目录
#工作目录为/idata/ai_lab/dongyiai/groupX/Y
#其中Y为学号,X为Y的最后一位数字,以2025001为例
cd /idata/ai_lab/dongyiai/group1/2025001
2、分析RNA-Seq数据¶
利用以下测试文件学习RNA-Seq数据分析的操作:
基因组:/idata/ai_lab/00Data/RNA-Seq/Genome/Forge_Genome.fa
基因组注释文件:/idata/ai_lab/00Data/RNA-Seq/Annotation/Forge_Anno.gtf
RNA-Seq数据:/idata/ai_lab/00Data/RNA-Seq/Raw_data/
RNA-Seq脚本:/idata/ai_lab/00Data/RNA-Seq/rna.sh
#激活环境
micromamba activate ai_lab
#以C1为例
#a、质控
fastp -w 1 -i /idata/ai_lab/00Data/RNA-Seq/Raw_data/C1/C1_R1.fq.gz -I /idata/ai_lab/00Data/RNA-Seq/Raw_data/C1/C1_R2.fq.gz -o C1_R1.fq.gz -O C1_R2.fq.gz -h C1.html -j C1.json
#b、比对
hisat2 -p 1 -x /idata/ai_lab/00Data/RNA-Seq/Genome/Forge_Genome -1 C1_R1.fq.gz -2 C1_R2.fq.gz | samtools view -bS /dev/stdin | samtools sort -l 6 /dev/stdin -o C1.bam
#c、定量
stringtie C1.bam -e -p 1 -o C1.gtf -A C1.fpkm_tracking -G /idata/ai_lab/00Data/RNA-Seq/Annotation/Forge_Anno.gtf
#用同样的方法获取其他样本表达量,这里用chatgpt生成了一个脚本批量执行
bash /idata/ai_lab/00Data/RNA-Seq/rna.sh
#d、生成表达量矩阵
本站总访问量 次
Authors:

