跳转至

demo2-需求文档

1、编写一个程序帮忙删除数据分析过程中的临时文件,临时文件有以下四种类型:
原始文件:比如/share/home/lxl/08Users/yhfu/04Projects/006_idata_sheep/data/input目录,里面每一个文件夹是一个样本
QC文件:在/share/home/lxl/08Users/yhfu/04Projects/006_idata_sheep/anaylysis/work/results目录中的QC文件夹中,其中每种目录也是一个样本
mapping文件:在上述results目录的mapping文件夹,其中每种目录也是一个样本
calling文件:在上述results目录的calling文件夹,其中每种目录也是一个样本

2、四类文件的依赖关系为原始文件通过分析生成QC文件,接着QC文件分析后生成mapping文件,同理最后生成calling文件,所以上述每个类型的处理逻辑如下:
原始文件:样本对应的QC文件生成后即可删除对应样本的原始文件,原始样本中存在一系列的gz文件,文件名为SRR29726865_1.fastq.gz的形式,其中SRR29726865被称为run,如果通过run查询[[接口文档#run的QC完成状态接口]],发现一个原始样本文件中的所有run都能查询到,则该样本已经生成了完整QC文件,此时直接删除原始样本目录即可
QC文件:利用样本名称通过[[接口文档#样本的mapping完成状态和深度接口]]查询样本的mapping文件是否已经生成,如果已经生成则删除QC样本目录中的gz文件,同时将QC样本目录移动到/share/home/lxl/08Users/yhfu/04Projects/006_idata_sheep/anaylysis/ok_results/QC目录
mapping文件:利用样本名称通过[[接口文档#样本的calling完成状态接口]]查询样本的calling文件是否已经生成,如果已经生成则通过[[接口文档#样本的mapping完成状态和深度接口]]查询其有效深度是否大于等于20,如果大于等于20则将mapping文件目录移动到/share/home/lxl/08Users/yhfu/04Projects/006_idata_sheep/anaylysis/ok_results/mapping,否则直接删除样本目录
calling文件:利用样本名称通过[[接口文档#样本的calling完成状态接口]]查询样本的calling文件是否已经生成,如果已经生成则将样本目录移动到/share/home/lxl/08Users/yhfu/04Projects/006_idata_sheep/anaylysis/ok_results/calling

本文阅读量  次
本站总访问量  次
Authors: Wind