成本和数据质量依然困扰CIO的BI战略
有些痛苦从来都与我们如影随行,比如数据的质量和成本问题。当SearchCIO.com就当前在大数据和云计算的时代背景下BI(商业智能)面临的新挑战访问两位专家时,发现这两个问题依然是业界关注的焦点。
“无论数据的规模大小和新旧程度如何,BI面临的最大挑战可能还是数据本身的质量。”Gartner的著名分析师Bill Hostmann表示。
BI专家Boris Evelson是Forrester Research Inc.的高级分析师,他基于其在该领域数十年的经验来阐述观点:“现在的数据质量和30年前一样糟糕。而提升数据质量主要是个经济问题,相应的成本还是太高了。”
如今的CIO们可能对数据质量的理解更为深刻,而且手头也有更多的工具来提升数据质量。有人认为基于云的BI产品有助于成本的降低,但是我们的专家却对云计算和数据质量之间的相关性提出了质疑。数据质量方面的问题核心在于数据总是处在变化之中:新系统的上线以及新数据源的涌现。而数据的规模也在急剧膨胀,比如事务日志、来自于传感器的数据、点击流量以及Hostmann特别指出的“社交媒体导致的信息爆炸”。
与此同时,除了数据之外其他事情也在发生变化。BI已经从由IT部门单独掌控变为整个企业全员参与。而且,数字质量本身的定义也不是一成不变的。因此,对于CIO来说,真正要面对的问题应该是:就当前的工作来说,什么样质量的数据是合格的?
“对信息提供者谈数据质量并没有太大意义。”Hostmann说:“真正重要的是信息的使用者在基于数据进行分析或决策时的满意度,他们的期望才是问题的核心所在。”
数据的质量取决于提问人的身份、问题的急迫性以及愿意为之付出的成本。人们越来越意识到建议单一的评判体系是不现实的。Evelson表示:“质量是相对的,和具体语境有关。”
数据质量满意度的季度调查
既然数据质量是相对的,并且让用户可接受是BI的一个重要方面,那么对此CIO们该如何应对呢?
Hostmann对其客户的建议是,通过对企业内关心数据质量的决策人进行例行调查,以此建立数据质量的评判体系。Gartner使用一套简单的工具来评估用户对BI数据的满意度,以及客户基于数据进行商业决策的能力。调查结果应该每个季度进行一次更新,因为数据质量的定义也在变化中。
找到合适的主导人
在企业不同业务单元之间,这类调查的结果会大相径庭,从而导致关注的热点游离不定。这样就带来了一个问题:哪方面数据的质量对于企业战略目标有着最大的影响?Hostmann认为这个问题主要取决于经济方面的考虑,但是确定各个问题的优先级却不是技术人员的责任:“应该由业务负责人来下结论,但是这其中存在极大挑战。”
“IT对数据并没有控制权。”Evelson认为。和其他的企业应用不同,BI从本意上来说就需要由业务端来主导。IT团队有能力为企业构建系统来定义如IBM一样的庞然大物,但是值得与否需要由其他人来决定。“这肯定不是IT的职责。”Evelson认为:“因为这是整体战略级别的决策。”
不同用户需要不同的工具
基本上,CIO们在调查数据质量满意度时会发现用户大致可以分为高级和低级两类,其中后者可能对自己的无知都一无所知。数据发掘工具(Data discovery tools)对低级用户来说非常适用,可供挖掘隐藏的数据之间的关系,而且也比较便宜。“无需多维数据库(multidimensional databases)你也可以对外提供海量数据,用户自己通过工具能进行分析。”Hostmann说。
高级用户一般来自于财务部门或者那些受到严格监管的行业。他们清楚地知道自己想要什么,而且可以发现数据质量的问题。但是,是否修正问题就得看情况了。比如,要修正对于“客户”一词的定义就需要对系统大动干戈 – 从而又一次导致成本的问题。“虽然看到了问题,但是他们到底愿意花多少钱来解决问题呢?”Hostmann质疑到。
Evelson认为,即使成本问题得到解决,也不能期望质量问题就不复存在了。CIO们几乎肯定会遇到这种问题:首席财务官、首席营销官和销售副总裁对于客户利润率的定义各执一词。“这会导致IT无所适从。”Evelson表示。最后,再重申这一点:有些痛苦永远不会散去。
集成系统网络情报信息数据库
CIO频道人物视窗
CIO频道方案案例库
大数据建设方案案例库
电子政务建设方案案例库
互联集成系统构建方案案例库
商务智能建设方案案例库
系统集成类软件信息研发企业名录

