更新时间:2023-01-08 12:04
模式识别问题就是对观察到的物理对象进行识别与分类。模式识别无所不在,我们每一天都在进行着成功的模式识别。
根据对某个物理对象的观测信息,利用计算机对该物理对象进行分类,从而给出该物理对象所属的类别。在这里,“模式”就是指存储于计算机内的有关物理对象的观测信息,它可以是图像、声音、温度、压力等任何可以测量的观测量。为了让机器自动完成模式识别任务,我们需要数据采集设备和模式识别算法。
对外界事物的感知与识别是智能的基础。如果我们能够很好的解决模式识别问题,就能够制造出更高级的智能系统。一个例子是手写体识别。另一个例子是自动驾驶系统。模式识别在计算机学科中的地位:模式识别是计算机科学与控制科学的一个交叉学科,是智能系统及智能信息处理的一个重要基础。
概述
许多实际的模式识别问题如对手写体汉字的识别, 都属于大规模的模式识别问题。目前,传统的神经网络
算法对这类问题尚无有效的解决办法。在球邻域模型的基础上提出一种可用于大规模模式识别问题的神经网络
训练算法,试图加强神经网络解决大规模问题的能力,并用手写体汉字识别问题检验其效果。实验结果揭示了所
提算法是解决大规模模式识别问题的一个有效且具有良好前景的方法。
神经网络发展至今,由于其并行和容错等特点,在很多方面,尤其是在模式识别领域已经表现出一定的优势和潜力。然而,随着研究的深入,人们已经逐渐认识到就目前情况来看,神经网络尚不能有效解决大规模的模式识别问题。大规模的模式识别问题是指问题的特征空间维数高,样本数量大而且类别多。像手写体汉字识别、 汉语的音节识别等许多实际问题都是这类问题的典型代表,因此,解决这类问题对于神经网络理论上的完善以及技术上的实用化都具有重要的意义
张铃等人给出了一种新的M2P神经元的几何意解释——球邻域模型,并在此基础上提出了多层前向网络的交叉覆盖设计算法。该算法将神经网络的训练转化为几何的覆盖问题,思路独特,而且已经在小规模问题中取得了较好的结果。这里以球邻域模型为基础提出一种新的前馈神经网络训练算法,并以手写体汉字为例,进一步研究神经网络处理大规模问题的能力。
用单一的网络同时处理几千个汉字尚有很多困难,在初步研究阶段,较为可行的方法是先将汉字进行粗分类,然后对每个“粗类”中的样本进一步识别。
算法及其基本思想
模式识别的Bayes决策理论中要求知道样本的概率分布,这在实际问题中是很难做到的,所以,在模式识别的统计方法中有许多理论 (如似然法) 都是有关样本概率分布的估计的,其中许多估计方法都是用形式和数目预先确定的分布函数的线性组合 (如高斯函数) 去逼近样本的分布。现有的前馈网络在求解模式识别问题时, 其中心思想是建立样本和其类别的映射, 然而其训练方法是基于预先给定的评价函数的极小化,其本质也是用形式和数目预先确定的多个函数 (即隐层单元的输出函数) 的组合去逼近这一映射。可以看出,这两种方法都是从已知形式和数目的函数的组合入手来分析,而没有直接从样本数据本身入手来推测有关性质。这里提出的算法就是向这个方向发展的一种初步的尝试,即直接从样本数据本身来逼近它在空间中分布的状况,并以此为依据构造神经网络。该算法用多个MP神经元所对应的多个“球邻域”去覆盖各类的所有训练样本,由于神经元的有关参数和个数都是直接由训练样本通过样本空间的分布直接决定的,所以该算法出发点不是要得到样本分布的解析表达式,而是用这些神经元的覆盖区域的组合近似“勾勒”出各类样本分布的几何区域。而当判断一个新的样本应该属于哪一类时,只需判断它被哪个几何区域所覆盖,该区域所对应的类别就是答案。因此,该算法不要求预先固定隐层单元的个数,这就为神经网络的构造提供了很大的灵活性。
概述
目前,神经网络已在模式识别领域得到了广泛应用,但对于那些样本量巨大输入维数较多的复杂的模式识别问题,直接用神经网络处理时训练速度往往慢得令人难以忍受,并且存在容易陷入局部极小点造成识别错误的问题。
加快训练速度的一种方法是将庞大的样本训练集分成若干个小训练集,采用并行神经网络分别对小训练样本集进行处理。在实用中,当训练集中的样本量不大时,在目前的计算机运算速度水平上 即使输入维数较多,也可以很快完成对样本集的训练。因此,问题就转化为分类和训练两个子问题,在这种情况下,单靠一种模型是不能取得很好效果的,必须针对不同的子问题,选择最适合于解决该问题的模型。因此,对于复杂的问题而言,采用多种模型混合的方法是一条更有效的途径。这里引入了串-并行混合结构的多种神经网络模型,该模型不对输入模式进行预处理,而是直接通过串行分类神经网络将大样本集分成几类,以减小训练集中的样本规模,再用并行神经网络对每一类的小样本集进行训练。
串-并行混合的多种神经网络模型
考虑到人脑在进行判断时既具有高度的并行性,同时也有这样的特点,先根据样本的主要特征将其分成若干大类,然后在大类中再根据其它特征进行识别和判断。我们将这种思想融入已具有并行性的神经网络中,提出了串-并行混合的多种神经网络模型。
这个网络结构共分为两部分:串行部分和并行部分。串行部分由分类网络(CNN)实现对输入样本的分类,并行部分为多个并行执行的识别网络(RNN) 每个识别网络完成一类样本的处理,加快处理速度。
系统的输入是未经预处理的模式输入参数,如对16x16的汉字,则直接输入值为 或 0 1的256个点阵,以避开特征抽取的难点,并提高处理速度。
分类网络的目的是将所有样本分类。因为样本集非常庞大,且随时都可能出现新的模式需要归类,BP网显然力不从心,而ART网表现了其在这方面的良好的效率和性能,并且可根据总样本集的大小和识别难度通过警戒参数来控制分类结果,因此这里采用ART1作为分类网络。
识别网络的任务是在属于同一类的模式中进行更细的分类,由于每一类别中的模式数目已经不是很多,BP网训练速度的劣势已不是很明显,而其可进行非常细致的分类的优点远非ART所能及。因此模型中选用BP网作为识别网络。