该项目已存档,不再维护。
普拉达
概述 | |
描述 | 普拉达是分析配对结束RNA-SEQ数据的管道,以产生基因表达值(RPKM)和基因融合候选者。 |
发展信息 | |
语 | Python |
当前版本 | 1.1 |
平台 | UNIX(OpenPBS) |
执照 | 麻省理工学院 |
地位 | 存档 |
最近更新时间 | 2013年4月 |
参考 | |
引文 | 没有正式出版物 |
帮助和支持 | |
接触 | mdacc-bioinfo-it-admin@mdanderson.org. |
从RNA转录的CDNA逆转的大规模平行测序(RNA喃)逆转录提供了对MRNA的量和组成的精确估计。通过分析RNA-SEQ数据来表征转录组,我们开发了PRADA。普拉达侧重于基因表达估计,监督和无监督的基因融合鉴定的加工和分析,并监督内瘤缺失鉴定。管道生成的BAM文件与用于突变调用的不同工具易于兼容,并获得进一步下游分析的读取计数。
PRADA目前支持6个模块来处理和识别RNASEQ数据的异常:
预处理 | :生成对齐和重新校准的BAM文件。 |
融合 | :识别候选基因融合。 |
猜测-FT. | :监督搜索融合成绩单。 |
猜测 - 如果 | :监督搜索沟里重排。 |
同源性 | :在给定的两个基因之间计算同源性。 |
框架 | :预测融合转录物的功能后果 |
详细说明安装步骤和使用示例的每个模块的使用说明文件。
PRADA以Python编程语言编写,旨在在UNIX或Linux操作系统上的命令行环境中运行。要运行pyprada,下载预编译包并解压缩到首选安装位置。组合基因组和转录组参考文件可供下载:
HG19.
还提供了一个样本FASTQ文件和结果BAM文件示例文件。
下载并提取参考文件后,为参考文件夹中的所有Fasta文件生成索引文件:
[pyprada_dir] /tools/bwa-0.5.7-mh/bwa index-a bwtsw [hg19] / ensembl64.transcriptome.fasta [pyprada_dir] /tools/bwa-0.5.7-mh/bwa index -a bwtsw [hg19]/ sensembl64.transcriptome.formatted.fasta [pyprada_dir] /tools/bwa-0.5.7-mh/bwa index -a bwtsw [hg19] / ensembl64.transcriptome.plus.genome.fasta [pyprada_dir] /tools/bwa-0.5。7-MH / BWA索引-A BWTSW [HG19] / Homo_SAPIENS_ASSEMBLY19.FASTA
设置配置文件(ref.txt):
#reference文件compdb_fasta [hg19_ref] / ensembl64.transcriptome.plus.genome.fasta compdb_fai [hg19_ref] / sensembl64.transcriptome.plus.genome.fasta.fai compdb_map [hg19_ref] / ensembl64.transcriptome.plus.genome.map genome_fasta [hg19_ref] / homo_sapiens_assembly19.fasta genome_gtf [hg19_ref] / homo_sapiens.grch37.64.gtf dbsnp_vcf [hg19_ref] /dbsnp_135.b37.vcf select_tx [hg19_ref] / sembl64.selected.transcripts feature_file [hg19_ref] / ensembl64.canonical.gene.exons。Tab.txt tx_seq_file [hg19_ref] / ensembl64.transcriptome.fasta ref_anno [hg19_ref] / ensembl64.trancriptome.annotations ref_map [hg19_ref] / ensembl64.transcriptome.formatted.map ref_fasta [hg19_ref] /ensembl64.transcriptome.bromatted.fasta cds_file [hg19_ref] / ensembl.hg19.cds.txt txcat_file [hg19_ref] / ensembl64_primary_transcript.txt #preprocess步骤参数pbs_queue long #queue name,用于预处理模块pbs_email userid@mdanderson.org #email用于通知psitications_n_threads 24 #number使用的核心在对齐A.重新校准