数据湖

建设背景

融合多源系统数据,保持数据原样格式,以任意规模存储所有结构化和非结构化数据,解决系统间数据孤岛、各类应用统一访问问题,能同时支撑批量和实时数据操作处理和分析,提高数据可获取性

优势特性

数据集中贴源

把不同结构数据统一采集存储,对业务数据“原汁原味”的保存,数据资源不断融合

数据灵活访问

采用“读取模式”,按照业务需求灵活对数据进行加工处理,使用时方便连接和访问

丰富的计算引擎

支持批处理、实时计算、交互式分析到机器学习多种计算引擎,满足业务对计算的要求

多模态存储引擎

支持存放结构化、非结构化数据,综合考虑响应时间、并发、频次等多因素选择不同存放方式,满足不同应用对数据存储需要