方案概述
随着数字化的深入,客户需要对存量数据进行分析,挖掘业务价值。这些存量数据被多样化的系统管理,比如关系型、非关系型、文本、文件等,多样化的系统如何高效地集成到数据仓库中,如何对这些质量参差不齐的数据进行质量优化,对其进行分层治理,进而开放到各个商业分析(BI)系统,或者数据消费测,面临数据集成、数据治理、数据开放等一系列诉求。
LOGO
面临挑战

异构数据来源多样化

来自不同供应商的系统,数据格式、接口协议各异,对数据采集和数据转换形成很大挑战

数据质量参差不齐

存量数据可能由机器生成,由人工录入,在统一性、完整性、准确性上标准不一,数据质量对业务分析的质量影响巨大

数据治理门槛高

数据治理对人员的SQL、脚本语言能力要求比较高,如何降低操作门槛,使他们能快速理解数据、高效治理

数据安全风险高

不同数据来源系统对于数据的权限各自管理,如何在数据仓库中对集成和开放的数据进行有效的权限管控
方案优势
高性能分布式数据仓库存算引擎
HexaDB-A(Analytic Edition)支持全并行向量存算引擎,TPCH基准测试优于业界主流数仓产品
40+异构数据源高性能集成
HexaDB-A(Analytic Edition)与鲁班、灵渠深度融合,支持多种异构数据源集成,支持RPA集成,支持实时数据集成
多维度数据质量清洗与优化
内置六个维度质量探查与优化:完整性、‌及时性、‌准确性、‌有效性、‌一致性、‌唯一性;拥有业界领先的海量数据去重能力
高效智能的治理任务编排
鲁班基于微服务架构的可视化任务编排,错误处理,血缘检测,任务智能调度引擎,单集群同时支持高达1000+个任务
低门槛数据治理交付
低代码治理任务开发,支持SQL,脚本多种任务定义方式,引入NL2SQL技术,支持自然语言输入进行数据治理开发
安全的角色和权限管控
鲁班融合海纳数据库,支持系统级和业务数据行列级权限管理,支持数据水印,动态脱敏
客户案例