新一代生物信息学工具无需编程专家就能进行大数据分析
DrBioRight使用自然语言界面为更广泛的研究社区提供直观的数据分析188bet体育网址
2020年9月24日,MD Anderson新闻发布
一种新的数据分析工具188bet体育网址德克萨斯大学安德森癌症中心合并一个用户友好的,自然语言的界面,允许生物医学研究人员没有生物信息学或编程语言的专业知识,进行直观的分析大数据集。188bet体育网址
这个开放获取、人工智能(AI)驱动的程序被称为DrBioRight,旨在降低所有研究人员充分利用现代研究方法产生的越来越多的数据的障碍。188bet体育网址一份关于这个平台的报告今天发表在癌症细胞.
“我们认为,我们可以通过创建一个任何研究人员都可以使用的工具,改进目前进行常规生物信息学分析的模型,并大大加快周转时间,”他说188bet体育网址汉梁博士。教授生物信息学和计算生物学.“我们对bioright博士的长期目标是成为每一位研究人员的智能合作者。”188bet体育网址
现代生物医学研究中使用的高通量技术产生大量、复杂的数据集,提供有关患者、动物模型或正在研究的细胞系的全面信息。188bet体育网址这些可能包括,例如,研究整个遗传信息(基因组学),基因表达(转录组学),或蛋白质表达(蛋白质组学)。
梁教授解释说,由于这些“组学”数据集非常复杂,如果没有专门的分析方法,回答特定的生物学问题会很有挑战性。这些分析通常使用用各种编程语言编写的计算机脚本来完成,这需要对编程和生物信息学有一定的了解。
生物信息学家可以帮助导航和处理这些复杂的数据集,但这项工作可能很耗时。因此,研究团队开发了DrBio188bet体育网址Right,使研究人员能够更容易地通过一个友好的聊天界面与自然语言交互,对自己的数据进行常规分析。
梁解释说,面向自然语言的程序允许用户像自然说话一样问程序问题,而不是用复杂的程序语言。
学术研究人员可以免费获得bioright博士。188bet体育网址最初,该项目有一些现成的模块来处理最常见的生物信息学问题,包括一些最常用的公共癌症数据集,如癌症基因组图谱和癌症细胞系百科全书。
作为对该方法的确认,研究人员使用DrBioRight复制了一篇经典癌症基因组学188bet体育网址论文的分析,发现它准确地重现了之前发表的结果。
因为这个程序是由人工智能驱动的,它也有能力从每一个查询中学习,并改进分析,随着时间的推移,它会成为一个更有用的工具。展望未来,研究人员希望改进DrBioR188bet体育网址ight,让用户能够分析自己的数据集,并允许对新模块进行开放开发。
“在我们努力改进这个项目的同时,我们也想让其他生物信息学家贡献他们的算法并教授bioright博士,”梁说。“整个研究界的参与将有助于创造一种工具,更有效地回答复杂的188bet体育网址研究问题。”
这项研究得188bet体育网址到了美国国立卫生研究院(U24CA209851, U01CA217842, P50CA221703和P30CA016672)、梁的MD安德森教师学者奖和洛林戴尔生物信息学癌症药物个性化项目的支持。
其他合作者包括:生物信息学和计算生物学专业的李俊博士、陈虎、王玉萌博士和陈梅菊May博士。H. Chen和Y. Wang也是德克萨斯州休斯顿贝勒医学院定量和计算生物科学研究生项目的成员。在论文全文中可以找到作者披露的完整列表在这里.