发布网友 发布时间:2022-05-10 21:17
共1个回答
热心网友 时间:2023-11-01 13:16
OneData体系:即建立企业统一的数据公共层,从设计、开发、部署和使用上保障了数据口径的规范和统一,实现数据资产全链路管理,提供标准数据输出。该体系包含:数据规范定义体系、数据模型规范设计、ETL规范研发以及支撑整个体系从方法到实施的工具体系。
以数据规范体系为例,不同于以往分部门的指标混乱定义做法,OneData体系中,我们将此前个性化的数据指标进行规范定义,抽象成:原子指标、时间周期、其他修饰词等三个要素,如下所示:
例如,以往业务方提出的需求是:最近7天的成交。而实际上,这个指标在规范定义中,应该结构化分解成为:
原子指标(支付订单金额)+修饰词-时间周期(最近7天)+修饰词-卖家类型(自营)。
这样做的好处是指标口径复用性强,可以极大的精简复杂的指标体系,便于理解和使用。
企业可借助工具来帮助规范数据开发过程,如阿里云或袋鼠云的数栈——大数据开发套件,来替代传统的人工经验+人工约定模式,从根本上解决数据指标口径一致,各种场景下看到的数据一致性得到保障。