数据与信息

更新时间:2020-04-21 20:52

有一句话是这么说的“数据是爆炸了,信息却很贫乏”,那么数据信息之间到底有什么关系呢?

联系

数据和信息之间是相互联系的。数据是反映客观事物属性的记录,是信息的具体表现形式。数据经过加工处理之后,就成为信息;而信息需要经过数字化转变成数据才能存储和传输。

区别

那么,数据是否就是指可以存储和传输的信息呢?未必!数据和信息是有区别的。从信息论的观点来看,描述信源的数据是信息和数据冗余之和,即:数据=信息+数据冗余。

数据是数据采集时提供的,信息是从采集的数据中获取的有用信息。

由此可见,信息可以简单地理解为数据中包含的有用的内容。不严格的说,“不知道的东西,你知道了,就获得了一个信息”。

也可以说数据在未被接收对象获取前可以称为数据,一旦被对象获取,即可称为信息。

定量分析

上面定性分析了数据和信息之间的区别和联系,下面对数据和信息进行定量分析。数据量和信息量之间会有什么联系呢?是不是数据量越大,其中包含的信息量就越多呢?不一定。比如,有人说“人的嘴巴上方有鼻子,鼻子上方有眼睛”,因为这是预料中的事,所以你从这个消息中得到的信息量很少。但如果有人说“人的鼻子上方有嘴巴,嘴巴上方有眼睛”,就会让人很震惊,因为这是预料之外的,这样的信息量就很大。这说明了:一个消息越不可预测,它所含的信息量就越大。

事实上,信息的基本作用就是消除人们对事物了解的不确定性。信息量是指从N个相等的可能事件中选出一个事件所需要的信息度量和含量。从这个定义看,信息量跟概率是密切相关的。在概率论中,用P(x)表示在N个相等的可能事件出现某一个事件的概率,即P(x)=1/N。信息量I(x)定义为:

I(x)=log2N = -log2(1/N )= -log2P(x)

结合概率论知识,推而广之,可以用下面的公式——称之为熵H(x)公式来表示一大堆数据带来的平均信息量。

注意:这个平均信息量不是算术平均,是概率论的统计平均——数学期望值。

免责声明
隐私政策
用户协议
目录 22
0{{catalogNumber[index]}}. {{item.title}}
{{item.title}}