数据治理的核心是数据模型、数据质量、数据标准、主数据管理、数据生命周期、数据管理和数据安全。
1. 数据模型——做建模
首先,需要由业务人员提出业务需求,并描述业务需求所需的数据内容。
其次,通过业务人员及技术人员合作,根据业务对象抽象出数据概念,定义其描述、分类与关系。
然后,技术人员根据数据概念描述、分类,抽取出数据实体,并利用ER图描述其关系。
最后,技术人员针对数据库特性将数据实体物化为数据库表,支撑实际应用。
2. 数据质量——做清洗
由于互联网及通信技术的飞速发展以及数据量的爆发式增长,各类数据也大规模增长,然而,其中无效数据同样也将大幅度增多,这就要求企业需要对数据质量进行限制。依据相关规范对数据质量即数据的及时性、完整性以及准确性进行限制,详细地通过事前防范、事中监控、事后管控3个时间段进行监督。
3. 数据标准——做统一
根据已确定的企业核心逻辑数据模型,将模型中的数据项抽取出来。然后根据预定的业务数据项筛选方法,筛选出需要进行业务定义的数据项。
再根据业务对所筛选出的业务数据项进行分类,产生用于通用数据标准及公共代码定义的数据标准项清单。而具体的通用数据标准的制定包括定义工作目标、流程、及模版,其分类标准则根据数据在业务中的使用频度和业务需求,参考业界模型,通过汇总分析,对通用数据进行分类,形成统一的数据标准在数据层面的定义,并以数据项自然分类为基础,对数据进行分类。
4. 主数据清理——做编码
主数据是描述核心业务实体的数据,是企业内跨业务重复使用的数据,存在于多个异构的应用系统中,是关键数据,而不是全部数据;是操作性数据,动态参与业务流程,而不是静态数据。
在企业中主数据是全员共享,全员服务的重要数据,与其他数据分离,作为单独的部分进行管理。
5. 数据生命周期——做管理
数据的生命周期包括数据创建、数据使用、数据归档、数据销毁4个阶段。
而数据在生命周期内有效则可以满足业务操作和管理分析的需要;满足对历史数据查询相关政策和管理制度的要求;满足审计管理要求;减少数据冗余,提高数据一致性;减少存储、硬件、运维等方面基础设施投入;提升应用系统性能,提高响应速度。因此,数据生命周期的管理必不可少。
首先,在数据创建阶段,要求利用数据模型保证数据完整;执行数据标准保证数据准确;加入数据质量检查创建准确;保证数据在合理的系统生成。
其次,在数据使用阶段,要求利用数据监控数据使用;利用数据标准保证数据准确;利用数据质量检查加工准确;确保数据在合理的系统使用;控制数据的派生。
然后,在数据归档阶段,要求利用评估手段保证归档时机;分数据类型归档数据。
最后,在数据销毁阶段,要求利用评估手段保证销毁时机;分数据类型销毁数据。
6. 数据清理——做规格
数据是数据仓库的灵魂,它不仅提供了数据仓库中数据结构的逻辑层,也提供了数据仓库的构建和使用规则。
为了使数据仓库中各个软件能够无缝地合作,必须在数据层进行有效的集成。所以,研究数据的作用与意义相当重要.数据是关于数据的数据,即是对数据资源的描述,按其描述对象的不同可以分3大类:技术数据、业务数据和管理数据。
7. 数据安全——做防范
数据治理的一个重要作用是保障数据的安全。应该从企业级、体系化视角开展数据安全管理顶层设计。
数据统一分类分级后,通过数据鉴权来控制某一类数据可以被哪些系统调取,可以被哪些人员查看,可以被哪些部门共享,对不符合权限的对象进行限制,有效的防止数据泄露风险。
0人已收藏
0人已打赏
免费0人已点赞
分享
闲聊茶吧
返回版块114.55 万条内容 · 192 人订阅
阅读下一篇
数据分析治理与数据保护的协同性那么,我们有怎样的数据分析治理工具呢?泛企业的数据资产发现和数据治理工具并不缺乏,它们将数据的管理范畴像“虚拟组织”那样从业务范畴中抽象出来。可是我们知道企业的数据每年以50%的速度增长,数据发现、分类、分级、变迁、使用等,会遇到诸多技术和管理问题。况且业务系统中的数据是动态变化的,治理一个变化中的对象需要对它进行持续的管控,管理和控制的逻辑叠加在业务系统上有时并不合适。于是,从业务系统中抽离数据资产自然而然成为科技部门的一个任务。抽离就是从业务系统中把数据复制出来,建立一个生产数据的“孪生数据”,一个处理业务逻辑和业务压力,另一个处理管理逻辑和管理压力。数据复制如同印刷术在IT的发展史上已经存在了很多年。
回帖成功
经验值 +10
全部回复(0 )
只看楼主 我来说两句抢沙发