AstraZeneca与MongoDB加速研发


  • 管理員

    去年,制药巨头AstraZeneca开始了一个雄心勃勃的计划,使用下一代基因组测序来开发药物以对付各种疾病,包括癌症。

    这项技术创造了信使RNA的合成版,帮助细胞产生蛋白质。如果成功,这些蛋白质可以对抗癌症,以及其他疾病。

    不幸的是,这样的基因组测序需要大量的计算能力。AstraZeneca的研发信息架构师Jason Tetrault最近解释说,分析88个全人类基因组,花费了15,000小时及产生了171 TB的数据。 分析单个人类基因组可能需要四天时间。

    幸运的是,遗传学的突破与计算能力的巨大飞跃相吻合。 特别是,MongoDB的跨平台、面向文档的数据库已经到了可以大规模的处理这样的数字的程度。 “我会把MongoDB包含在非常具有颠覆性技术的阵营中,”Tetrault说, “任何帮助我们加快步伐,继而帮助我们更快地找到东西的事物都是伟大的。”     对于Tetrault来说,基因组测序是对非结构化数据挑战的典型例子。AstraZeneca选择MongoDB主要由于其文件存储能力。 然后是,公司提供午餐,并学习教育员工。 他说:“当然是午餐和学习,每个人都会去吃免费午餐。”

    这些例子也帮助员工参与进来。 Tetrault指出,Craigslist和MTV等其他公司使用MongoDB来跟踪和安排他们巨大的数据量。 Tetrault说如果把这些名字“真的打开了讨论...这会是一个‘哦哇’的时刻。”

    也许让每个人都参与进来的最有说服力的策略是展示MongoDB如何能够相对快速地获得有用的成果。他说:“找一些困难的事情,让它变得简单。”

         AstraZeneca的实验包括提取10%的化合物,并从不同的数据库系统中提取信息。使用MongoDB,该公司能够对约5亿种化合物进行Tanimoto比较。Tetrault说 :“所有这一切,都在我的办公桌上”     尽管处于这过程的早期,Tetrault说他很兴奋,AstraZeneca可以利用MongoDB来帮助抵抗癌症。“我一直支持着癌症研究人员。我们的研究人员正试图找出哪种药物对特定肿瘤类型最有效。”通过对数据的更大的指导,Tetrault说AstraZeneca可以追溯以前从未注意过的链接和模式。“也许这在肝癌中有10%的效果,但是可能实际上肺癌也具有相同的生物标志物。这就是我想问的问题,这也是为什么我对大数据技术感兴趣。”

    有兴趣学习更多吗?观看完整的演示文稿。或者来到MongoDB World,您可以从数十名MongoDB用户那里听到有关MongoDB如何更快地构建应用程序。


登录后回复
 

与 萌阔论坛 的连接断开,我们正在尝试重连,请耐心等待