新知榜官方账号
2023-09-24 23:14:35
云音乐在过去九年中发布过九款独立的产品,包括国内产品和海外产品。所有产品的数据支撑都在数仓开发部门。在这个背景下,我们从多个角度对数据现状进行了分析。
在数据背景下,我们明确了治理方向:获取到完整准确的元数据信息,只有这样才能进行有效的数据治理。治理过程中,从技术视角来看,数据内容的分布情况如上图所示。随着业务的快速发展,数仓的不断迭代,每块内容可能或者必然存在着哪些问题。所有的问题都指向了同一个方向,就是我们要获取到完整准确的元数据信息,只有这样才能进行有效的数据治理。
从元数据出发,我们从猛犸平台上获得了比较完备的元数据信息,包括表的元数据信息,以及任务的元数据信息。基于这些元素信息进行数据建模,在CDM层产出了比较丰富的模型,可以从各种视角看到整个资产的情况,以及模型设计健康度的情况。整个元数据建模支撑了云音乐的整个数据治理体系。
在治理实践中,首先要做的就是权责有归属。所有的数据、表和任务都应该有具体的责任人对其负责,这样在发现问题时才能找到具体的人去进行处理。在推进过程中,面临的问题是具体要做的治理事项需要覆盖到不同的团队或者不同的部门去执行,而且每个具体事项的治理动作也是多元化的,不同业务团队以及不同人的认知以及能力、精力的投入都是不一样。因此,我们统一建立了一个通用的推进机制,以及一个通用的治理原则。在具体实践中,我们进行了各个方面的治理,包括游离HDFS文件治理、库治理、表治理、三度指标治理和计算治理等。通过治理,我们取得了成本收益、治理资产沉淀和数仓开发规范沉淀等多方面的成果。
数据治理是一个长期而且持续要做的事情。在治理的过程中,我们将从分散到集约、从被动到主动到自动、从经验到智能的治理理念。整个治理动作分为三部分,包括:事前、事中和事后。我们将继续推进数据治理的各项内容,包括预防性治理、治理监控指标工具落地、治理指引报告和数据开发规范等。
微信扫码咨询
相关工具
相关文章
相关快讯
推荐
阿里Accio中文版上线!一键搞定复杂采购
2025-08-19 09:13
视频“用嘴编辑”的时代来了,但钱包顶得住吗?
2025-08-15 17:59
智谱新模型GLM-4.5V全面开源,玩家们有福啦!
2025-08-12 17:56
扎心文案+AI插画=爆款!揭秘8万赞视频的制作全流程
2025-08-12 10:08
GPT-5没你想的那么好,附实测体验~
2025-08-11 11:07
一站式搞定AI绘图+视频,AI短片效率飙升的秘密在这儿!
2025-08-08 09:26
打工人新神器!10款国产AI,让你告别996!
2025-08-08 09:24
豆包视觉推理深度体验,AI也能“边看边想”了!
2025-08-08 09:19
300美元的AI男友来了!马斯克的情感生意从女友做到男友
2025-08-01 17:56
Agent智能体:2025年企业新员工,月薪仅需一度电?
2025-07-30 17:49