GSOL
世界经理人
论坛
  • 全站
  • 文章
  • 论坛
  • 博客
高级

信息质量特征:信息内容质量(中)

分享:

【接《信息质量特征:信息内容质量(上)》】

2.信息质量度量

信息质量特性要求不同的衡量技术的支持。有一些信息特性可以用软件这种电子手段衡量。其他一些特性比如准确性,则要用物理的比较方式来完成,这种方式要求将数据与现实世界中的对象或者某个事件的记录进行对比。

  • 定义一致性。数据值要与属性的定义相符。

度量方法:电子或人工检查

如果属性是个日期,表达的事实的值属性理所当然的是日期型。同理,地址属性表达的必须是地址。代码和代码的值所表达的内容也应该与事物分类相吻合。

 

  • 完整性。每个流程或决策所需要的全部信息都应具备。

    记录完整性。企业所需要的对现实世界的每一个对象或事件的记录都应该具备。

度量方法:电子检测或人工检测。

要弄懂自己所不懂的事情并非易事。人们一般不容易觉察一些对象与事件的记录丢失了。没有将应该记录下来的信息或者删除了不该删除的信息等等,都会造成记录的丢失。

当处理这些难以确定的对象时,通常不得不找到较为可靠的源头来对比现有数据。

在发现数据丢失并且将丢失项加到数据库中以后,应该计算一下丢失记录百分比,这个值应该用丢失的记录数量/(丢失的记录数量+正常的记录数量)来计算。

    值完整性。每一个给定的数据元素都应该拥有所有记录所不可或缺的

度量方法:电子检测。

现实世界的特征丢失了,那么在创建记录的过程中某些数据元素也就丢失了。举个例子,某个员工在职时,我们能把有关他的所有数据都记录下来,一旦他离职,那么后面的数据就丢失了。

当有效参数值变成一种强制类型时,这类属性应该具有相应的业务规则说明。

  • 有效性。数据的值要符合信息产品的规格说明。

    值有效性。数据的值应该是个有效值或者是符合规定该数据元素有效值变化范围的值。

度量方法:电子检测。

使用简单的查询语句来检测数据元素的值是否为指定的有效值之一,或者检测数字型的数值是否在指定的或合理的数值范围内。

    业务规则有效性。数据的值符合规定的业务规则。

度量方法:电子检测。

用电子检测把执行业务规则和捕获数据的过程区分开来。

这些业务规则可能包括合理性检验或相关性检验,保证值符合业务规则或合理性。

NOTE:业务规则也很可能是错的。有时现实世界的数据值看似在预期值的范围之外,但实际上它却是正确的。

    推导有效性。根据某个规定的计算公式或推导规则,能准确地产生数据的计算值或推导值。如果原始数据是准确的,并且能正确的执行计算的过程,那么结果就是准确的。

度量方法:电子检测。

可以通过独立地执行重建计算或分类的查询语句的方法评估推导有效性。

NOTE:首先确认方案或派生规则的准确定义。这些定义可能随着时间的变化而过时。

  • 准确性。数据的值是正确的。

    数据源准确性。数据应该与可确定的原始数据记录相吻合,并且保证其来源可靠。如出生证明、文档文件或者从组织外部接收的电子数据等。

度量方法:电子检测或人工检测。

这种检测就像把你的电子数据和外部的权威来源比较一样简单。(比如,邮政服务数据和地址之间的比较)

NOTE:关于数据源的准确性度量,你必须先弄清楚数据源到底有多准确。邮政服务数据只能保证某个地址的正确性,但不能保证这个地址上的人没有发生变化。

一定要理解所有代理源使用的局限性并将其文档化。

    事实准确性。数据应该能够精准的反应现实世界的对象或事件。准确性则是对信息固有特性的最高要求。

度量方法:电子检测或人工检测。

这种检测就像把你的电子数据和外部的权威来源比较一样简单。(比如,邮政服务数据和地址之间的比较)

NOTE:关于数据源的准确性度量,你必须先弄清楚数据源到底有多准确。邮政服务数据只能保证某个地址的正确性,但不能保证这个地址上的人没有发生变化。

一定要理解所有代理源使用的局限性并将其文档化。

  • 精确性。数据的值要精确到某个合适的标准。比如价格要精确到分,时间要精确到秒。

度量方法:电子检测或人工检测。

根据数据的性质,检测方法可能包括对精确的记录装置和更准确的度量装置进行比较,或者会包括确保数字数据,如货币汇率,能精确到合适的位数。

统计学的分析应该在科学研究、调查或者样本数据的质量评估中一直显示信息的置信度和置信区间。

 未完待续……

分享:

确认推荐关闭

是否确定推荐本文?

   

推荐标题:

确定 取消

 

分享

我要评论

你还没有登录,无法回复主题,请首先 登录 或 注册 (关联新浪微博帐号)

 
 
 
 

博主档案

帮助客户普及数据质量管理概念,摆脱因劣质信息对企业造成的不良影响,提升其各种系统的数据质量,并从高质量的数据中获取回报。

220

23123

3


还未进入100强,请继续努力

 

最具潜力的博客新星更多>>