生物资讯及计算生物学学系

首页>公共软件>缪斯女神

缪斯女神

隐藏的行 对于表布局
概述
描述 下一代测序数据中肿瘤正常配对样本的体细胞点突变调用者。
发展信息
GitHub danielfan /缪斯
语言 C / c++
当前版本 1.0 rc
平台 平台无关的
许可证 GNU GPL版本2
状态 活跃的
参考文献
引用 张建民,张建民,张建民,张建民,张建民,张建民,张建民,张建民,张建民,张建民。使用样本特异性误差模型来解释肿瘤间异质性提高了需要测序数据的突变的敏感性和特异性。基因组生物学.2016.https://dx.doi.org/10.1186%2Fs13059-016-1029-6
帮助和支持
联系 Wenyi王
讨论 GitHub上

缪斯女神

体细胞点突变的检测是癌症基因组研究的关键组成部分,自下一代测序(NGS)技术显示其在描述癌症基因改变方面的潜力以来,该研究得到了迅速发展。188bet体育网址提出了一种基于分子进化F81马尔可夫替代模型的突变调用新方法MuSE1,它模拟了参照等位基因的进化,以匹配肿瘤和正常组织在每个基因组位点的等位基因组成。为了提高整体准确性,我们进一步采用样本特异性误差模型来识别截断点,反映样本间肿瘤异质性的变化。

下载

源文件:https://github.com/danielfan/MuSE

Linux二进制文件:MuSEv1.0rc_bMuSEv1.0rc_c

安装

下载源文件后,如属类unix操作系统,请在命令行内按顺序输入以下命令,以生成可执行文件:

解压MuSEv1.0rc.zip cd MuSEv1.0rc make .zip

对于Windows,请安装Cygwin首先,它提供了类似于Windows上的Linux发行版的功能。以下步骤与上面相同。

输入数据

MuSE由两个步骤组成,这需要

第一步,“MuSE调用”作为输入(1)和(2)。BAM文件要求使用Burrows-Wheeler对齐工具(BWA)将所有读取的序列与参考基因组对齐,使用回溯或最大精确匹配(MEM)算法2.此外,需要按照基因组分析工具包(Genome Analysis Toolkit, GATK)最佳实践来处理BAM文件3.45包括标记重复,联合重新排列配对的肿瘤正常BAMs和重新校准基本质量分数。

为了加快' MuSE调用',我们建议使用提供的选项' -r '或' -l '将WGS数据分割成小块(<50Mb),并通过Linux命令CAT连接所有输出文件。

第二步,' MuSE sump ',从' MuSE call '和(3)中获取输出文件作为输入。我们提供了两个选项来构建特定于样本的错误模型。一个适用于WES数据(选项' -E '),另一个适用于WGS数据(选项' -G ')。

示例命令

以下命令将简要说明MuSE的使用方法。关于BAM文件的准备,请参考基因组分析工具包(GATK)最佳实践(http://www.broadinstitute.org/gatk/guide/best-practices).

./MuSE call -O输出。前缀- f参考。肿瘤基因组。/MuSE sump -I Output.Prefix.MuSE.txt -G -O Output.Prefix.vcf -D dbsnp.vcf.gz

输出

MuSE的最终输出是一个VCF文件,它列出了已识别的体细胞变体。

参考文献


  1. DNA序列的进化树:最大似然方法。分子进化杂志17,368 - 376(1981)。(返回)
  2. 快速准确的短读对齐与Burrows-Wheeler变换。生物信息学(牛津,英国)25,1754 - 1760(2009)。(返回)
  3. 麦肯纳等人。基因组分析工具包:一个用于分析下一代DNA测序数据的MapReduce框架。基因组研究20188bet体育网址,1297-1303(2010)。(返回)
  4. DePristo, m.a.等人。利用下一代DNA测序数据的变异发现和基因分型框架。《自然·遗传学》43,491-498(2011)。(返回)
  5. Van der Auwera等人。从FastQ数据到高置信变量调用:基因组分析工具包最佳实践管道。生物信息学当前协议11,11.10.1-11.10.33(2013)。(返回)