FamSeq
概述 | |
描述 | FamSeq是一个计算工具,用于计算基于家族的测序数据中的变异概率 |
发展信息 | |
GitHub | wwylab / FamSeq |
语言 | c++ |
当前版本 | V1.0.2 |
平台 | 平台无关的 |
许可证 | GPL v3 |
状态 | 活跃的 |
最后一次更新 | 07/01/2014 |
新闻 | 版本1.0.2包括基于gpu的计算选项。 |
参考文献 | |
引用 | 彭刚,范毅,沈平,卢泰豪斯,Chi A., Davis R.W., Huff V., Scharfe C.,王伟。罕见变异检测采用基于家族的测序分析.PNAS110p3985(2013)。https://doi.org/10.1073/pnas.1222158110 |
帮助和支持 | |
联系 | Wenyi王 |
稀有变异的命名仍然是一个挑战。在以家庭为基础的测序研究中,应该利用来自所有家庭成员的信息来更准确地识别新的种系突变。FamSeq通过提供一个人在他/她整个家庭的原始测量值下携带变异的概率来实现这一目的。FamSeq适应从头突变,可以在chrX执行变异调用。
FamSeq采用可能性和广泛使用的vcf文件作为输入。
在v1.0.3更新:允许从FreeBayes输出VCF。
1.从压缩文件中提取文件
tar xvf FamSeq1.0.2.tar.gz
对于windows用户,请检查在这里提取文件。
2.构建FamSeq
CPU版本:
cd FamSeq / src /
GPU版本:
cd FamSeq/src/ make -f生成文件
如果你在XCode 5中使用MacOS 10.8,或者在编译GPU版本时出现“unsupported option ' -dumpspecs '”之类的错误,请使用下面的命令进行编译
让- f makefile.gpu.clang
3.运行测试数据
CPU版本:
以VCF文件作为输入:
./FamSeq vcf -vcfFile ../TestData/test. .vcf -pedFile . . / TestData / fam01。-output test.FamSeq.vcf -v .输出
只可能格式化文件作为输入:
./FamSeq LK -lkFile ../TestData/loftest.txt -pedFile ../TestData/fam01. txtped与产出test.FamSeq.txt
GPU版本:
以VCF文件作为输入:
./FamSeqCuda vcf -vcfFile ..vcf -pedFile . . / TestData / fam01。-output test.FamSeq.vcf -v .输出
只可能格式化文件作为输入:
./FamSeqCuda LK -lkFile ../TestData/loftest.txt -pedFile ../TestData/fam01. txtped与产出test.FamSeq.txt
剧情简介
FamSeq vcf -vcfFile输入。vcf -pedFile输入。ped与产出输出。vcfFamSeq路-lkFile lk.txt -pedFile input.ped -output output.txt
命令和选项
首先根据输入文件类型指定命令。如果输入文件是VCF文件,命令为vcf。如果它是一个可能的格式文件,命令是LK。
vcf
FamSeq vcf [-method 1] [-mRate 1e-7] [-v] [-a] [-l] [-vcfFile] [-pedFile] [-output] [-LRC] [-genoProbN] [-genoProbK] [-genoProbXN] [-genoProbXK] [numBurnIn] [numRep]
选项:
存储谱系信息的ped文件的名称。家谱应该是一个完整的家庭,这意味着除了家族的创始人之外,每个家庭都有双亲。ped文件中有五列。第一列是单个id,它应该大于0。第二和第三列是母亲的id和父亲的id。如果个体是家庭的创建者,那么将父母的id设置为0。第四栏是性别。1:男,2:女。如果性别设置不正确,会在X染色体上造成一些错误。最后一列是vcf/likelihood only格式文件中的个人名称。如果在vcf/likelihood only格式文件中没有个人信息,在ped文件中设置个人名称为NA。如左侧所示的系谱。这个家族有6个人。 All individuals other than the grandfather were sequenced. Then the vcf file or the likelihood only format file look like the following:
然后构造相应的ped文件。确保ped文件中的个人名称与vcf文件中的相同。祖父应该包含在ped文件的个人名称NA,即使在vcf/likelihood only格式文件中没有关于他的信息。该文件如下所示:路
FamSeq LK [-method 1] [-mRate 1e-7] [-lkType n] [-v] [-a] [-l] [-lkFile] [-pedFile] [-output] [-LRC] [-genoProbN] [-genoProbK] [-genoProbXN] [-genoProbXK]
选项:
输出
FamSeq通过在原始输入文件中添加三列作为输出文件来创建一个新文件:GPP、FPP和FGT。GPP为基于单个体方法计算的后验概率,FPP为FamSeq计算的后验概率。这些概率都是phred标度的。FGT是FamSeq所称的基因型。