新知榜官方账号
2023-09-24 23:14:35
云音乐在过去九年中发布过九款独立的产品,包括国内产品和海外产品。所有产品的数据支撑都在数仓开发部门。在这个背景下,我们从多个角度对数据现状进行了分析。
在数据背景下,我们明确了治理方向:获取到完整准确的元数据信息,只有这样才能进行有效的数据治理。治理过程中,从技术视角来看,数据内容的分布情况如上图所示。随着业务的快速发展,数仓的不断迭代,每块内容可能或者必然存在着哪些问题。所有的问题都指向了同一个方向,就是我们要获取到完整准确的元数据信息,只有这样才能进行有效的数据治理。
从元数据出发,我们从猛犸平台上获得了比较完备的元数据信息,包括表的元数据信息,以及任务的元数据信息。基于这些元素信息进行数据建模,在CDM层产出了比较丰富的模型,可以从各种视角看到整个资产的情况,以及模型设计健康度的情况。整个元数据建模支撑了云音乐的整个数据治理体系。
在治理实践中,首先要做的就是权责有归属。所有的数据、表和任务都应该有具体的责任人对其负责,这样在发现问题时才能找到具体的人去进行处理。在推进过程中,面临的问题是具体要做的治理事项需要覆盖到不同的团队或者不同的部门去执行,而且每个具体事项的治理动作也是多元化的,不同业务团队以及不同人的认知以及能力、精力的投入都是不一样。因此,我们统一建立了一个通用的推进机制,以及一个通用的治理原则。在具体实践中,我们进行了各个方面的治理,包括游离HDFS文件治理、库治理、表治理、三度指标治理和计算治理等。通过治理,我们取得了成本收益、治理资产沉淀和数仓开发规范沉淀等多方面的成果。
数据治理是一个长期而且持续要做的事情。在治理的过程中,我们将从分散到集约、从被动到主动到自动、从经验到智能的治理理念。整个治理动作分为三部分,包括:事前、事中和事后。我们将继续推进数据治理的各项内容,包括预防性治理、治理监控指标工具落地、治理指引报告和数据开发规范等。
相关工具
相关文章
相关快讯
推荐
用Deepseek写AI绘图提示词,像呼吸一样简单!
2025-02-19 16:12
你以为AI绘画是黑科技?其实早成了“路边摊生意”!
2025-02-19 10:15
Flux爆火,全网最全面最详细的Flux使用教程!
2025-02-18 14:19
用AI如何创作音乐,实战教学来啦!
2025-02-17 17:23
MidJourney让你秒变绘画大神,从零开始画哪吒!
2025-02-17 14:56
AI应用新境界:让人工智能成为你的得力助手
2025-02-14 15:45
AI短片革命:当创作遇上智能,人人都能成为导演
2025-02-14 14:53
AI狂潮下的人类职场:是失业危机还是进化契机?
2025-02-13 16:53
开启影视创作新纪元,效率提升 10 倍的神器来了!
2025-02-13 15:11
深度解析DeepSeek:当AI技术照进创作产业的未来
2025-02-12 17:16