准确的电话号码和 WhatsApp 号码提供商。 如果您想要电子邮件营销活动列表或短信营销活动,那么您可以联系我们的团队。 电报: @xhie1

不出所安妮反对建立数据湖的论点既有说服力又充满激情。我的朋友,你提出了一些很好的观点,但你让这对我来说太容易了。在我开始反驳 [我的下一篇文章] 之前,我想澄清一下您提出的一些事情。我把它归结为三个问题。你说呢? 图像 不出所料,安妮,你反对建立数据湖的论点既有说服力又充满激情。我的朋友,你提出了一些很好的观点,但你让这对我来说太容易了。在我开始反驳 [我的下一篇文章] 之前,我想澄清一下您提出的一些事情。我把它归结为三个问题。你说呢? 更多阅读 图像 数据湖辩论:结论(向滚石乐队致歉) 数据湖辩论:Pro 提供最终反驳和总结 数据湖辩论:否定的最终结论 数据湖辩论:专业人士首次反驳 数据湖辩论:负面影响 图像1. 在您的论点中,您关注的是数据量和支持这些大数据量的开源软件 (OSS) 的辅助成本。

然最近的研究表明

组织并不关心他们的数据量——并不是每个人都是谷歌或 Facebook——他们关心的是数据的多样性和整合所有数据的能力。您如何解决这些问题? 图像我怎么强调都不够,带入数据湖的数据是共存的,而不是集成的。即使使用模式读取,集成也发生在存储环境之外——在这个美丽的数据湖的岸边。每个需要 数据库 新数据结构或模式的查询都需要从头开始编写。对于大多数组织而言,这种广泛编码(对于仍然新颖的技术)所需的时间和人才的成本价值比即使不是不存在也是有限的。从 Hadoop 访问和集成数据所需的技能和能力使得可用人才变得稀缺。你是对的,不是每个人都是谷歌或 Facebook。组织的员工不具备这些技能,也没有预算来培养这些技能。 Hadoop 确实提供了绝佳的数据存储机会,但它并不要求我们放弃所有现有的结构化数据环境。

数据库

将现有的结构化数据

尤其是交易数据复制到数据湖将是重复的工作和存储,并且会给组织带来额外的风险。移动运营数据将是一件大事,因为它需要整个组织的应用程序进行重大的编码/设计改革,这在任何业务部门都不会成为流行的想法。 理想的场景是将现有数据保留在当前位置,并使用 Hadoop 作为以前由于数量、种类或 投注电子邮件列表 速度限制而无法存储的数据的存储库。组织可以利用数据虚拟化工具,不仅可以消除集成编码挑战,还可以获得集中式安全和治理等其他优势。数据根据需要进行查询、转换和结构化,并通过虚拟视图提供给业务用户。没有数据倾销——只有有目的的访问、集成和使用。 图像2. 关于第一个问题,您说:“在组织开始探索数据湖中的功能之前,他们应该首先转向充分利用他们当前的数据。

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注