“泛魔”识别模型

更新时间:2022-05-09 19:33

一种以特征分析为基础的图像识别系统。

简要介绍

1959年B.塞尔弗里吉把特征觉察原理应用于图像识别的过程,提出了“泛魔”识别模型。这个模型把图像识别过程分为不同的层次,每一层次都有承担不同职责的特征分析机制,它们依次进行工作,最终完成对图像的识别。塞尔弗里吉把每种特征分析机制形像地称作一种“小魔鬼”,由于有许许多多这样的机制在起作用,因此叫做“泛魔”识别模型。这一模型的特点在于它的层次的划分。

层次模型

“泛魔”识别模型系统的图像识别共有4个层次(见图“泛魔”识别模型图象识别示意图)。第一层是执行最简单任务的“映象鬼”,它们只是记录外界的原始形象,正像视网膜获得外界刺激的映象;然后由“特征鬼”进一步分析这个映象。在分析过程中,每个特征鬼都去寻找与自己有关的图像特征。例如,在识别英文字母时,每个特征鬼负责报告字母的一种特征及其数量,如垂直线、水平线、斜线、直角、锐角,不连续曲线和连续曲线等;再由“认知鬼”接受特征鬼的反应,每个认知鬼都从特征鬼的反应中寻找与自己负责识别的图像有关的特征,发现了这种特征时,它就“叫喊”,发现的特征越多,“叫喊”声越大;最后,“决策鬼”根据许多“认知鬼”“叫喊”声的大小,选择叫喊声最大的“认知鬼”的反应作为所要识别的图像。

模型应用

例如在识别字母R时,“映象鬼”先对R进行编码,把信息传递给“特征鬼”作进一步加工,这时会有5个“特征鬼”分别报告图像所包括的一条垂线、两条水平线,一条斜线,3个直角和一条不连续曲线。然后许多“认知鬼”则根据所报告的这些特征及其数量来识别是否是自己负责的字母。这时D、P、R鬼都会有反应,但P鬼只有4个特征与其符合,并有一特征(斜线)与其不符合;D鬼只有3个特征与其符合,并有两个特征(斜线、直角)与其不符合;只有R鬼有5个特征与其符合,而且这5个特征又包括了R的全部特征,所以R鬼的叫喊声最大,因此“决策鬼”就很容易地作出选择R的决定。

“泛魔”识别模型对于相似的图形也可以分辨,不致混淆;对于失真的图形,如字母的大小发生变化时,识别也不致发生困难。以特征分析为基础的“泛魔”识别模型是一个比较灵活的图像识别系统。它可进行一定程度的学习,如“认知鬼”可逐渐学会怎样解释与它所负责的字母有关的各种特征;它还可以容纳具有其他功能的鬼。这个系统现在也被用来描述人的图像识别过程。

免责声明
隐私政策
用户协议
目录 22
0{{catalogNumber[index]}}. {{item.title}}
{{item.title}}