GSOL
世界经理人
论坛
  • 全站
  • 文章
  • 论坛
  • 博客
高级

信息质量特征:信息内容质量(下)

分享:

【接《信息质量特征:信息内容质量(中)》】

 

  • 唯一性。在一个数据库中,用以代表现实中给定对象或者事件的记录,有且只有一个。

度量方法:电子检测。

在度量唯一性时,我们应使用几种相关联的测试方法来判定两个记录是否是现实世界中对同一事物的重复描述。

最好的搜索算法使用模糊配对,并允许存在交换错误、典型的拼写错、姓名或字词的缩写、同义词,等等。

 

  • 源头保障。信息的源头应该:保证它所提供的信息的质量;建立保证档案书,用以记录其在获得、维护以及交付信息时所能提供的质量管理功能;提供客观且可证实的信息质量衡量标准,这些标准应用一种符合质量特征的方式提供。

度量方法:电子检测或人工检测。

NOTE:有些人把可靠性称为信息质量特征。这种主观的度量会随着时间改变。一个较好的度量特征是从信息源处获得书面的质量保证。凭证就是一个可信任的认证机构是不是能认证源的信息质量过程。另一种检验的方法是客观地通过信息质量对各种重要的特征进行度量。

 

  • 冗余或分布式数据的等效性。对于同一个客观对象或者事件,一个数据库中对其的表述应该与其他数据库中存储的数据相同。

度量方法:电子检测或人工检测。

如果一个数据库和另一个数据库之间存在最小的转换,并且数据库保持常见的主标识符,度量该特征就很简单。

如果存在转换,那就必须定义用来比较一个数据中的有效参数值和其他数据库中可比较的代表数值的测试方法。

如果数据库不能共享主标识符,那么必须先尝试着执行重复匹配来鉴别两个数据库中的等效记录。只有通过对一个数据源元素和另一个数据元素进行比较才能检查两个数据库中的值是否具有相同涵义。

 

  • 冗余或分布式数据的并发性。信息传递时间或者说时延应该降低到信息在ab之间传递时所需要的最小值,其中a代表一个已知的主数据库,而b代表另一个已知的冗余或者分布式数据库,而并发性就意味着这些不同的数据库能够产生相同的结果。

度量方法:电子检测。

通常,度量信息流的电子检测包括记录标记。

另一个方法是度量从首次在第一个数据库中建立记录到记录被完全导入到下游数据库的过程中花费的时间。

 

总结

知识工作者对参与到其工作中的信息有不同的质量需求。信息质量专家必须清楚这些需求并度量正确的事情。信息生产者必须了解这些需求以满足所有信息消费者的需要。

 

分享:

确认推荐关闭

是否确定推荐本文?

   

推荐标题:

确定 取消

 

分享

我要评论

你还没有登录,无法回复主题,请首先 登录 或 注册 (关联新浪微博帐号)

 
 
 
 

博主档案

帮助客户普及数据质量管理概念,摆脱因劣质信息对企业造成的不良影响,提升其各种系统的数据质量,并从高质量的数据中获取回报。

220

28934

3


还未进入100强,请继续努力

 

最具潜力的博客新星更多>>

 
 
 
 
 
 
一键发帖 资讯订阅
世界经理人 iphone app
世界经理人微信 为你推送和解读最专业的管理资讯