当前位置: 首页 > 新闻资讯  > 数据中台

Apache Hudi 其技术差异及其成熟的数据湖平台如何领

数据湖最大的推动者是亚马逊和其他互联网制造商,这些互联网数字本土企业,其数字水平很高,面对激烈的市场竞争,不再满足于数据仓库的单一数据供应模式,互联网制造商数据科学家有足够的能力从数据湖获取原始数据、分析数据、处理数据直到挖掘数据,所见所得是数据科学家探索数据所需要的。

三是数据应用问题。数据湖最大的推动者是亚马逊和其他互联网制造商,这些互联网数字本土企业,其数字水平很高,面对激烈的市场竞争,不再满足于数据仓库的单一数据供应模式,互联网制造商数据科学家有足够的能力从数据湖获取原始数据、分析数据、处理数据直到挖掘数据,所见所得是数据科学家探索数据所需要的。

事实上,大多数企业只是把hadoophive作为一个廉价的数据仓库,可以处理大量的数据,以取代可能昂贵的MPP,但我们仍然使用MPP时代的数据仓库使用数据湖,从未改变,就像我买了一辆自动驾驶汽车,但从未使用过自动驾驶功能。

数据应用:智能应用,基于人工智能和机器学习分析,提供个性化服务;快速构建应用程序,收集、探索和分析细粒度的数据湖。

基于上述特点,业界普遍认为数据仓库增长良好,适合成熟规模企业,因为标准化注重规模效益。数据湖灵活性好,更适合初创企业,如下图所示:

目前发表的大多数比较文章似乎只将这些项目评估为传统的表/文件格式,只附加工作负荷,而忽略了一些对现代数据湖平台至关重要的质量和特点。这些平台需要通过连续的表管理来支持繁重的工作负荷的更新。本文将进行深入的讨论 Apache Hudi 其技术差异及其成熟的数据湖平台如何领先于其他平台。

本站部分内容及素材来源于互联网,如有侵权,联系必删!

相关资讯

    暂无相关的数据...