当前位置: 首页 > 新闻资讯  > 数据中台

数据湖支持一系列数据处理技术

该项目采用易华录自主研发的视网膜、迁徙、数据处理等产品,共获得5000多万条数据。敏捷的数据处理和更快的洞察力。其中,数据湖存储企业原始数据,包括结构化数据(主要是业务数据)和非结构化数据(包括日志文件、图片、音视频等),提供自助分析、用户肖像分析、数据挖掘探索、实时数据分析、图片分析、高并发查询、历史数据查询等数据服务场景;

采用私有云 公共云技术方案,确保技术的先进性。例如,在私有云环境中部署数据湖,方便人工智能、大量的数据培训,如机器学习;利用公共云先进的数据仓库框架、技术和产品,实现业务数据的数据集成和管理;

测试和实际运行的大量数据也将形成“数据湖”,为生产协调、安全控制、运行管理提供重要的数据支持,使系统不断变得“聪明”。

此外,3月2日,易华录在投资者互动平台上表示,公司在宁夏银川的数据湖项目已成功实施,并与中国电信共同建设了银川市兴庆区城市运营中心。该项目采用易华录自主研发的视网膜、迁徙、数据处理等产品,共获得5000多万条数据。

有人说数据湖是下一代大数据平台,主要云制造商也提出了自己的数据湖解决方案,一些云仓库产品也增加了与数据湖联动的特点。

我们认为易华录数据湖将是当地国有数据廉价、绿色、安全收集的最佳选择。从我们的实践来看,江西赣州、湖南长沙、广东茂名等数据湖城市已经完成了数据湖与地方政府云的结合,需要长期保存归档的政府数据已经成功进入湖中。与此同时,作为地方政府的重要服务提供商,三大运营商的归档数据已与易华录对接,并成功进入湖中。在基础设施建设层面,国家局还将建立足够的物理基础设施来收集数据,形成全国数据资源池,收集各级地方的数据。

敏捷的数据处理和更快的洞察力。数据湖支持敏捷的数据处理,使组织能够实时、快速地处理和分析大量的数据。这种数据处理速度可以实现更快的洞察力和决策,这在当今快节奏的商业环境中至关重要。数据湖支持一系列数据处理技术,如 Apache Spark 和 Hadoop,它们允许并行处理数据以获得更快的洞察力。

金融机构不断探索应用场景对数据的需求,积累结构化、半结构化、非结构化数据等不同类型的数据,采用不同的技术手段存储和处理各种数据。通常,数据存储方案主要是数据湖和数据仓库。其中,数据湖存储企业原始数据,包括结构化数据(主要是业务数据)和非结构化数据(包括日志文件、图片、音视频等),提供自助分析、用户肖像分析、数据挖掘探索、实时数据分析、图片分析、高并发查询、历史数据查询等数据服务场景;数据仓库主要存储和处理业务系统的结构化数据,沉淀企业级数据模型,处理指标、标签,提供BI报表、业务分析等数据服务场景。

易华录是中央企业华录集团唯一控股的上市公司。公司主要提供基于数据湖的数据要素资源和资本化服务。目前,其主要业务包括三个部分:数字经济基础设施、政府和企业数字化和数据运营服务。

从技术角度来看,数据分析层的部署是最复杂的,但也是最具创新性的。在本地化部署下,基于Docker技术的平台解耦解决了物理服务器资源供应弹性不足的问题,满足了存算能力的横向扩展。

自助数据访问。数据湖支持自助数据访问,使用户无需使用 IT 干预可以访问所需的数据。减少了这种自助服务方法 IT 团队的负担使他们专注于更具战略意义的任务。数据湖为数据提供了一个单一的真实来源,以确保所有用户都能访问相同的数据,从而降低数据岛的风险。

本站部分内容及素材来源于互联网,如有侵权,联系必删!

相关资讯

    暂无相关的数据...