多年来,在大数据时代正式开始之前,企业级数据仓库领域推动这个“全放在一个篮子里”的观点。但是如今,这个观点已经不再适用,在大数据时代,数据安全已经成为重中之重。即使是已经在数据挖掘领域成为领头羊的Hadoop也不能让我们放心。
数据安全
历史提醒我们,不要忘记过去的教训。具体地说,Hadoop在某些方面权力过度,长期困扰着市场。我指的概念,Hadoop可以并且应该中央整合数据中心所有业务的分析数据。
尽管一些企业顾客不希望把钱、时间、资源整合到一个完全不同的分析数据库平台,为此许多公司已经合并一些核心数据,但是这还依然远远不够。
事实上,大数据时代的时代精神已经开始转向 “混合”部署模型,混合企业级数据仓库,Hadoop NoSQL、内存和其他数据平台异构。
混合体系结构的上下文中,这“数据湖”的梦想似乎是特定于一个大数据部署角色:一个探索性的“沙箱”。很多数据科学家都涌向Hadoop作为a全部数据的“沙箱”, 正如此前讨论的那样。
毫无疑问,Hadoop正成为一个关键的应用程序开发和大数据分析平台。 但这并不意味着Hadoop将是唯一这样的平台。 事实上,每一个大数据平台Hadoop,MPP EDWs,NoSQL,内存,和流媒体,都可以作为一个应用程序开发和执行平台。
任何人认为将所有数据放在一个篮子里,靠唯一的应用程序来保证和开发都是完全错误的。