GenesMash API文档

Genesmash是关于人类基因的各种信息来源的捣碎。本写作时的主要来源是

  1. gene_info.来自NCBI Entrez Gene FTP站点的文件。
  2. Gene2Unigene.来自NCBI Entrez Gene FTP站点的文件。
  3. refflat.txt.来自UCSC基因组浏览器的文件。
  4. HSA.GFFmirbase文件。
  5. 从制造商(Affymetrix,Agilent和Illumina)网站中提取人类基因表达阵列注释信息。
    目前,来自上述指定制造商的各种人类基因表达式阵列平台的探针注释信息可在GenesMash提供

    笔记:与NCBI Entrez基因相关的微阵列探针仅包括在GenesMash数据库中。
其他来源可以在未来纳入。这些信息来源已被组合成一个简单的CouchdB.数据库。因此,我们可以构建工具,使得可以从其符号中找到基因的基因组定位,或者在其他类别的基因标识符之间易地映射。

输入和输出

使用REATFUL HTTP调用来使用GENESMASH Web服务读取数据或查询结果的所有呼叫。所有结果都以JavaScript对象表示法(JSON)返回。

GenesMash遵循通常的CouchDB惯例。每个对象都有一个唯一的标识符,在这种情况下由Entrez基因ID给出。例如,p53基因的Entrez基因ID恰好是“7157”。要获取P53 Gene的CouchDB文档的JSON表示,请向以下URI发送HTTP GET请求:

http://app1.bioinformatics.mdanderson.org/genesmash/7157

意见

CouchDB(以及GenesMash)查询也被称为意见。可用视图定义主API。在当前版本中,所有视图都包含在“基本”设计文档中。您可以通过向URI发送HTTP GET请求来获取设计文档的副本:

http://app1.bioinformatics.mdanderson.org/genesmash/_design/Basic.
要使用API​​,应以下面描述的每个呼叫

http://app1.bioinformatics.mdanderson.org/genesmash/_design/basic/_view/
虽然我们提供提供查询参数的调用示例,但每个参数由常规CouchDB接口定义。

未完成

http呼叫 json价值 结果
全部 {“total_rows”:...,“偏移”:...,“行”:[
{“ID”: ”...”,
“钥匙”: ”...”,
“价值”: { ... }}]}
从数据库中获取所有文档。
所有?限制= 10 与上述相同 从数据库中获取前10个文档。
by_symbol. 获取由HGNC符号排序的所有基因。
by_symbol?key =“tp53” 获取Gene TP53的文档
by_alias. 对于所有已知的别名或同义词,获取相应的基因。
by_alias?key =“ar” 用“ar”作为同义词获取所有基因。
by_cytoband?key =“17p13.1” 获取映射到给定细胞瘤的所有基因。
by_ensembl?key =“ensg00000012048” 使用给定的Ensembl标识符获取基因。
by_unigene?key =“hs.654481” 用给定的Unigene集群ID获取基因
by_probe2?key = [“Affymetrix”,“205241_AT”,“HG-U133A”] 使用给定的微阵列探针标识符获取基因
by_mir.
by_location.
gene_location.
最长长度
Minlength.