该项目已被归档,不再维护。
序列质量检查
概述 | |
描述 | 该服务提供了一种工具,用于预测序列是否代表真实的基因和功能性产品,或者给定序列或FASTA格式的序列列表,是否存在污染/转录噪声。 |
发展信息 | |
当前版本 | 1.0 |
帮助和支持 | |
联系 | MDACC-Bioinfo-IT-Admin@mdanderson.org |
给定一个序列或一系列FASTA格式的序列,本网站提供了一个工具,以预测它们代表真实的基因和功能产品,或可能源自污染/转录噪声。
幕后程序:
关于QDA幕后的任何问题,请联系张杰欣(jiexinzhang@mdanderson.org)
张捷新,张丽,凯文·库姆斯。
通过挖掘UniGene从属网络揭示基因序列的特征。生物信息学2006;22日:385 - 391。
对输入序列(s):
输入文件应该是FASTA格式的DNA序列,这意味着它以单行描述开始,后面跟着几行序列数据。序列必须至少包含字母。否则,由于序列太短,无法进行预测。
样本数据:
> gi | 58380931 | ref | XM_310883.2 |冈比亚疟蚊str CAGGGTTCGGACCCAAGGGTCGCCACCTGTCGCGGCAAGCTGCAGAGCAAGCGGTGCAAGCTGAACCAGG AAATCAACAAGGAGCTCCGGTTGCGGGCCGGTGCCGAAAACCTTTACAAGGCCACCACGAACAAGAAGCT CAAGGACACGGTCGCACTCGAGCTGAGCTTCGTCAACTCGAACCTGCAGCTGCTGAAGGAGCAGCTGTCC GAGCTGAACTCCTCCGTCGAGATCTACCAAAGTGAAGGCCTCGACTACGTTATACCGATGATACCGCTCGGGCTGAAGGAAACGAAGGAGGTCAACTTTATGGAACCGTTCTCGGACTTTATTCTGGAGCACTACAGCGA GCCGTCGCACATCTACGAGGACGCGATCGCCGACATTACCGACACGAGACAGGCCGCCAAAACGCCGACC CGCGATGCGCAGGGCGTTTCGCTGCTGTTCCGCTACTACAACCTGCTGTACTACGTCGAGCGGCGCTTCT TCCCGCCCGATCGCAGCCTGGGCGTGTACTTCGAATGGT > gi | 58378162 | ref | XM_308283.2 |冈比亚疟蚊strTTCACCGCAAACCTGCAGGGCGATTACATCAAGCATCCCGTGCTGTACGAGCTGAGCCACAAGTACGGCC TGCCGGACAATGTGTCCGAGCAGCTGCTGCCGGACCGGCTGGAGGAGATCAAGGAGGCGATCCGGCGCGA