行业动态| 数据中台:小数据的治理机制

发布时间:2019-12-13

近两年,在互联网领域,再也没有一个概念能够像数据中台那么火热。不仅是这个概念的首创者阿里在不遗余力地加紧宣传推广中台战略,连阿里的业务竞争企业如腾讯等也认同并推出自己的中台架构。越来越多的企业正加快开发数据中台产品或解决方案,唯恐落于人后。

而且,围绕中台这个概念,逐渐又发展出了数据中台、组织中台、业务中台等诸多概念。不过,在这些中台概念中,数据中台是其核心。

中台研究存在若干问题

目前,对于中台问题的研究存在着以下几个方面的问题。

首先,定义不清。目前对于中台的解释很不一致,有的定义甚至还谈不上是严格的定义,充其量只能说是对其某方面属性的简单描述,还谈不上是对其本质属性的界定。

其次,缺乏明确的架构模型。当前人们在讨论中台的信息化架构时,大多使用阿里巴巴业务架构中的“共享业务事业部”。而从逻辑上讲,“共享业务事业部”中的八大模块,其中的颗粒度并不一致。

最后,无法区别中台与平台、前台与后台、大数据等概念之间的相互关系。中台战略,必须说清楚中台是如何从后台分离出来以及分离之后的中台与后台的联系和关系。同时,上述众多中台的定义与大数据关联不够,光有“模块化、组件化、通用性”等特征是不够的,特别是无法深入地分析数据中台的独特性及其专业属性。所谓的数据中台与业务中台之间有着本质的不同,不应该简单地以“模块化、组件化、通用性”去模糊、掩盖其相互间的巨大差别。

科学界定数据中台问题的基本原则

中台为丰富信息化理论提供了很好的技术工具。为了克服当前有关中台理论构建及其信息化架构的诸多不足,有必要明确和理解以下三个方面的问题。

第一,遵循数据管理科学发展基本规律。最近十年来,数据资源管理科学正在不断出现新的技术与理论创新。

首先,主数据正在成为数据资源整合的一个崭新工具和手段,从近年来企业信息化和数据库建设实践来看,主数据及主数据管理已经成为人们建设基础数据库的基本方法。这些发展趋势表明,作为数据分离趋势中的主要内容形式的元数据、主数据应该成为数据中台的核心内容。

其次,这种技术与理论创新来自企业(信息)架构的不断深化。20世纪80年代出现的Zachmann模型有力地推动了企业架构技术的发展并带动企业信息架构技术的进步与发展,特别是在一些美国政府机构的作用下,企业信息架构标准化取得很大进展并成为国际标准化组织的规范来源。当前,企业信息化建设不仅需要构建技术架构、业务架构,也要构建其数据架构。

第二,数据中台是中台思维的核心。从企业架构的简要介绍可以看出,对于业务、技术和数据,必须分别地构建各自的业务参考模型,不应该简单地以所谓的“模块化、组件化、通用性”去抹平不同类型中台的独特性,特别是不能将所谓的业务中台的属性等同于数据中台属性。

老虎手游 不能将业务架构等同于业务中台架构。实际上,在FEA参考模型中,不仅有业务参考模型(BRM),也有服务构件参考模型(SRM)。从目前有关中台的“模块化、组件化、通用性”属性来看,服务构件参考模型(SRM)在很多方面与业务中台的含义最为吻合。因此,老虎手游 可以将服务构件参考模型看作是业务中台参考模型。

第三,合理地借鉴现有创新。政府的电子政务架构早已经发展出当前的中台思维。不过,电子政务领域的中台并没能得到推广,而且,当前电子商务(互联网企业)所倡导的中台战略与此似乎并没有传承关系,看过去更像是电子商务企业自己独立发现并发展起来的。我国电子商务企业发展出中台战略,显然要比电子政务中的中台做法晚得多。不过,我国电子商务(互联网)企业掀起的数据中台战略仍然具有重要意义。这表明,我国互联网企业已经走出“复制模仿”的困境,开始独立思考自己的业务系统规划。

小数据是理解数据中台关键

要正确地构建FEA的“数据构件参考模型(数据中台)”,关键是如何认识和理解大数据的管理属性,而其中的关键是如何认识小数据。

可惜的是,当前人们对于小数据的认识同样很混乱,至今也没对小数据形成一个统一权威的定义。不过,在正式厘清小数据的概念之前,有必要明确三个基本问题。

第一,人们采集、加工处理海量数据,通常都是某种具有特定目的的理性行为。因此,尽管大数据的容量很大、涉及的对象很多,但是人们通常会根据业务类型对这些海量数据进行分类处理。

第二,要体现出某种价值,数据本身必须能够表述一个完整的信息。无论是大数据中的数据还是小数据中的数据,都只是一个抽象的概念。单个的数据本身无法反映什么内容,必须是若干条数据综合在一起去反映某种信息。

第三,一条完整的信息应该包含一个明确的主体、客体和行为。通常情况下,主体和客体一般都与具体的现实对象(实体)关联在一起。

上述的三个基本问题,为老虎手游 界定小数据的内涵提供了基本思路,老虎手游 可以据此去明确那些界定小数据的基本属性:

第一,小数据应该与数据容量无关。第二,小数据自身应该包含特定意义。与大数据中的那些不能反映趋势性价值判断的零星数据不同,小数据应该是那些自身包含特定意义的数据,特别是能够反应大数据的某种基本属性。

第三,小数据应该是一种结构化数据。小数据的最大价值应该是既界定其他结构化数据的属性及结构,同时也应该能够被用于界定部分非结构化的数据。

第四,小数据应该是对于大数据(无论是结构化的还是非结构化的)的数据之间关系的宏观描述。“以小博大”(或者说“统筹大数据”)应该是小数据之于大数据的价值所在。

第五,小数据与大数据形影相随。与大数据相比,小数据的4V(volume、velocity、variety、value)发生了不少变化:小数据的数据容量(volume)肯定无法和大数据相比,数据类型(variety)以结构化数据为主;与大数据的时刻变化(velocity)相比,小数据的属性相对稳定;就等容量的数据而言,小数据的价值(value)要比大数据的大得多且明确得多。

老虎手游 据此尝试为小数据进行一次具体的定义:小数据就是描述并管理大数据的数据属性的数据。

将小数据看作是数据中台建设的核心,并不会降低数据中台建设的地位和作用。小数据系统建设仍然是一个非常复杂的工作,是一项系统工程,几乎涵盖企业信息化建设的各个方面,需要各方面的协同配合。尤其重要的是,小数据系统建设更多的是企业信息化建设的基础性工作。数据中台建设将克服之前的功利性和赚快钱思维,意味着(互联网)企业信息化建设将向纵深发展。

来源:人民邮电报

上一篇:关于北京人大金仓信息技术股份有限公司 下一篇:行业动态| 中关村大数据企业产业规模年均增长20%以上