案例研究:纽约时报运行MongoDB


  • 管理員

           

            也许您的业务已经确定了正确的运营模式,如果没有意外,将保持静态几十年。 但对于世界其他99.999%的企业来说,其所处的市场处于不断变化的状态,要求不断重复业务。正如纽约时报公司(NYT)的研发团队所发现的那样,应对当今业务不断变化的一个关键方式是建立在诸如MongoDB这样的灵活数据基础架构之上。

            NYT使用MongoDB背后的故事并不新鲜。NYT员工Jake Porway是数据科学家,他在2011年6月发表了关于媒体巨头如何在Project Cascade中使用MongoDB的演讲,Project Cascade是一个可视化工具,它使用MongoDB来存储和管理与《纽约时报内容相关的社交分享活动的数据。

            但是,最近的一个新发现是,在一直不断变化的商业环境中,实现如MongoDB这样的灵活数据基础架构非常重要。

    Project Cascade在Twitter上展示了《纽约时报的内容,让我们了解哪些内容是热门的,由谁推动。Joab Jackson为PCWorld写了一篇很好的书面报告,你还可以看到一个在线演示。

             对于《纽约时报来说,正如Porway所解释的那样:

            “[Project Cascade]允许我们[回答]的问题是真的很多,比如什么是最好的推文时间? 什么样的推文让人们乐于参与? Tweet对我们的自动消息源更重要,还是我们的记者本身?”

            想象一下,《纽约时报的编辑们确实需要收集不同的数据。 使用关系数据库,这将涉及到相当多的麻烦,但对于NYT的研发团队来说,这只是一个调整MongoDB数据模型的问题。 正如Porway所说“当我们不断更改我们想要查看的内容时,我们就不可能对PRBM模式进行调整。”

            NYT启动了Project Cascade,只需要两个星期的数据,只使用一个MongoDB实例,而不需要复制数据。 即使在每天有大约600贴文内容和25,000个Twitter链接的有限快照中,Project Cascade仍每月生成100 GB的MongoDB存储空间。

            追溯到2011年底,Project Cascade正在生产中,每天处理100,000条推文(和更多的点击次数),全部都是实时的。 这需要移动到一个四节点的MongoDB副本集,但它不涉及添加复杂的联接和其他关系型数据库特征。

            NYT公司的技术项目经理Deep Kapadia表示:“MongoDB允许我们很快地对原型进行设计。”这对任何企业应用来说都是重要的,因为它允许公司对其数据进行迭代。 大多数人从一开始就不知道他们的数据模型应该是什么样的。 《纽约时报》当然也一样。 正如Kapadia所说,NYT不需要提前做任何模式设计以从Twitter或Bit.ly获取字段,但可以简单地将所有数据转储到MongoDB中,并找出如何处理它。 这种灵活性很强大。

             当然,并不是所有的企业都希望像NYT的研究团队一样频繁地变化,但是在一个加速变化的世界中,越来越重要的是公司不会将严格的模式硬编码到他们的数据基础架构中。

             企业放眼未来也是很重要的。不管一个项目开始有多小,大数据还是会出现。 Porway解释说:“即使我们在开始项目时并没有处理大量数据,数据需求也会显著增加。”RDBMS扩展策略很快就变得昂贵和紧缩。 NoSQL扩展架构更加宽容。 MongoDB特别有用,因为它在单个节点上运行,就像在数百个节点上运行一样。 正如Foursquare等发现所发现那样,大规模总是从一个节点开始的。

             Google 和Twitter这样的网络公司首先遇到了RDBMS技术的限制,而现在主流企业正在赶上。《纽约时报自1851年以来一直持续出版,但自从互联网出现以来,其业务的性质发生了重大变化。对于 大多数企业来说也是如此。 像NYT一样,今天的大多数主流企业都将自己收集、过滤和分析来自各种来源的实时数据,以更好地了解客户和潜在客户,了解如何与其产品和服务进行互动。 MongoDB完全符合这个不断变化的世界。

             毫不奇怪,出版界和媒体界正在以非常公开的方式应对灵活数据模型的需求。 像NYT一样,英国的新闻出版商“Guardian”也使用MongoDB来帮助其自身适应数字化和商业模式。 为了灵活地迭代不同的用户参与模式,Guardian不得不放弃旧式的关系型数据库技术并转移到MongoDB。 

             并不是说MongoDB是完美的。正如Kapadia在Porway的原始演示文稿所强调的那样,肯定是可以科学有效的部署MongoDB的。 开始使用MongoDB是非常容易的,但它需要与任何关键数据基础架构相同的层次。

             如果Tim O'Reilly所说“数据是新的Intel Inside” 是正确的,那么在一个灵活的数据库中构建应用程序是非常重要的,这个应用程序不仅可以扩展以收集越来越多的数据,而且可以灵活地改变数据模型适应业务需求变化。 数据为使用它们的公司提供真正的竞争优势。 如纽约时报。

    标签:案例研究,“The Nerk Times”,“ Guardian”,灵活性,敏捷性,出版,媒体,MongoDB,RDBMS,关系型数据库,Jake Porway。


登录后回复
 

与 萌阔论坛 的连接断开,我们正在尝试重连,请耐心等待