数据湖
建设背景
融合多源系统数据,保持数据原样格式,以任意规模存储所有结构化和非结构化数据,解决系统间数据孤岛、各类应用统一访问问题,能同时支撑批量和实时数据操作处理和分析,提高数据可获取性
优势特性
数据集中贴源
把不同结构数据统一采集存储,对业务数据“原汁原味”的保存,数据资源不断融合
数据灵活访问
采用“读取模式”,按照业务需求灵活对数据进行加工处理,使用时方便连接和访问
丰富的计算引擎
支持批处理、实时计算、交互式分析到机器学习多种计算引擎,满足业务对计算的要求
多模态存储引擎
支持存放结构化、非结构化数据,综合考虑响应时间、并发、频次等多因素选择不同存放方式,满足不同应用对数据存储需要