生物信息学与计算生物学系

>公共软件>档案>普拉达

该项目已存档,不再维护。

普拉达

隐藏的行 对于表布局
概述
描述 普拉达是分析配对结束RNA-SEQ数据的管道,以产生基因表达值(RPKM)和基因融合候选者。
发展信息
Python
当前版本 1.1
平台 UNIX(OpenPBS)
执照 麻省理工学院
地位 存档
最近更新时间 2013年4月
参考
引文 没有正式出版物
帮助和支持
接触 mdacc-bioinfo-it-admin@mdanderson.org.

普拉达

从RNA转录的CDNA逆转的大规模平行测序(RNA喃)逆转录提供了对MRNA的量和组成的精确估计。通过分析RNA-SEQ数据来表征转录组,我们开发了PRADA。普拉达侧重于基因表达估计,监督和无监督的基因融合鉴定的加工和分析,并监督内瘤缺失鉴定。管道生成的BAM文件与用于突变调用的不同工具易于兼容,并获得进一步下游分析的读取计数。

模块

PRADA目前支持6个模块来处理和识别RNASEQ数据的异常:

预处理 :生成对齐和重新校准的BAM文件。
融合 :识别候选基因融合。
猜测-FT. :监督搜索融合成绩单。
猜测 - 如果 :监督搜索沟里重排。
同源性 :在给定的两个基因之间计算同源性。
框架 :预测融合转录物的功能后果

文件

详细说明安装步骤和使用示例的每个模块的使用说明文件

安装

PRADA以Python编程语言编写,旨在在UNIX或Linux操作系统上的命令行环境中运行。要运行pyprada,下载预编译包并解压缩到首选安装位置。组合基因组和转录组参考文件可供下载:

HG19.

还提供了一个样本FASTQ文件和结果BAM文件示例文件

下载并提取参考文件后,为参考文件夹中的所有Fasta文件生成索引文件:

[pyprada_dir] /tools/bwa-0.5.7-mh/bwa index-a bwtsw [hg19] / ensembl64.transcriptome.fasta [pyprada_dir] /tools/bwa-0.5.7-mh/bwa index -a bwtsw [hg19]/ sensembl64.transcriptome.formatted.fasta [pyprada_dir] /tools/bwa-0.5.7-mh/bwa index -a bwtsw [hg19] / ensembl64.transcriptome.plus.genome.fasta [pyprada_dir] /tools/bwa-0.5。7-MH / BWA索引-A BWTSW [HG19] / Homo_SAPIENS_ASSEMBLY19.FASTA


设置配置文件(ref.txt):

#reference文件compdb_fasta [hg19_ref] / ensembl64.transcriptome.plus.genome.fasta compdb_fai [hg19_ref] / sensembl64.transcriptome.plus.genome.fasta.fai compdb_map [hg19_ref] / ensembl64.transcriptome.plus.genome.map genome_fasta [hg19_ref] / homo_sapiens_assembly19.fasta genome_gtf [hg19_ref] / homo_sapiens.grch37.64.gtf dbsnp_vcf [hg19_ref] /dbsnp_135.b37.vcf select_tx [hg19_ref] / sembl64.selected.transcripts feature_file [hg19_ref] / ensembl64.canonical.gene.exons。Tab.txt tx_seq_file [hg19_ref] / ensembl64.transcriptome.fasta ref_anno [hg19_ref] / ensembl64.trancriptome.annotations ref_map [hg19_ref] / ensembl64.transcriptome.formatted.map ref_fasta [hg19_ref] /ensembl64.transcriptome.bromatted.fasta cds_file [hg19_ref] / ensembl.hg19.cds.txt txcat_file [hg19_ref] / ensembl64_primary_transcript.txt #preprocess步骤参数pbs_queue long #queue name,用于预处理模块pbs_email userid@mdanderson.org #email用于通知psitications_n_threads 24 #number使用的核心在对齐A.重新校准