1.3 粒计算的3个主要模型及其关系

虽然目前还没有一个公认的关于粒计算的精确定义,也没有一个统一的粒计算模型,但它被公认为是信息处理的一种新的概念和计算范式,覆盖了所有与粒度相关的理论、方法、技术和工具,主要用于不确定、不完整的模糊海量信息的智能处理,其实质是用简单易求、低成本的、足够满意的近似解替代精确解,即利用不精确、不完整、不确定和海量信息的可容度,实现问题的易处理、顽健性、低求解耗费以及与现实的友好性。粗略地讲,一方面它是模糊信息粒度理论、粗糙集理论、商空间理论、区间计算等的超集,另一方面它又是粒度属性的子集。具体地说,凡是在分析问题和求解问题的过程中应用了分组、分类和聚类手段的一切理论与方法,均属于粒计算的范畴。

1.3.1 词计算模型

人类思考、判断、推理主要用语言,而语言是一个很粗的粒,如何用语言进行推理判断,这就是词计算。Zadeh于1996年提出了“词计算理论”,标志着模糊粒度化理论的诞生。随后,Helmut教授的“词计算理论的语义模型”和Zadeh发表的文献促进了词计算理论的发展。词计算旨在解决利用自然语言,进行模糊推理和判断,以实现模糊智能控制。词计算理论对互联网上海量信息资源的高效利用有着深远的影响,由此,基于模糊集合论的词计算理论和模型的研究成为粒计算研究的主要方向之一。

Zadeh指出,人类认知的3个主要概念分别是粒化(Granulation)、组合(Organization)、因果(Causation)。他认为人类在进行思考、判断、推理时主要是用语言进行的,而语言本身就是“粒度”。粒化是将全体分解为部分;组合是将部分集合为全体;因果是挖掘出原因与结果之间的关系。对象A的粒化产生一系列A的粒,粒是指一些个体(元素、点等)通过不分明关系、相似关系、邻近关系或功能关系等形成的块,即每个粒为一簇点集,这些点难以区别,它们以不同的程度分属于几个不同的集合,是一种不确定现象。例如,人类头部的额头、鼻子、脸颊、耳朵、眼睛等,它们都是模糊粒,因为无法准确地划分它们具体的边界限位置。对于每个模糊粒,它都与一个模糊属性集联系在一起,比如头发,其模糊属性是颜色、长度、组织结构等,且每个模糊属性又与一个模糊值集联系在一起。在这里,模糊属性长度的模糊值包括长的、短的、不很长的等。这些模糊粒的属性及其模糊性都是在人类概念中形成、组织、处理并赋予特征值的。

总之,模糊信息粒化理论通过处理人类感知的信息,根据人类运用自然语言描述和分析事物的习惯进行运算,其运算对象是语言变量,即变量的值是用自然语言描述的词语或句子,是人类在一种不精确和部分真值的环境中做出合理决策的一种方法。

人的概念大都是模糊的,人脑在推理、形成概念粒方面的特点决定了信息的粒化具有模糊性。因此,模糊信息粒化正是这种能力的基础,是由定义它的广义约束来刻画的。在模糊逻辑中,它也是语言变量、模糊规则“if-then”以及模糊图的基础。这种划分上的不确定性是由于事物之间差异的中间过渡性所引起的,是事物本身固有的属性,它摆脱了经典数学中的二元性(非此即彼),使概念的外延具有一种模糊性(亦此亦彼)。

词计算就是在语言基础上发展起来的,是用词语代替数字进行计算和推理的一种方法。在词计算中,粒的概念是出发点。从本质上看,粒是点的模糊集,而这些点是一簇元素,由于相似性结合在一起。词是粒的标签,反过来粒是词的外延,一个词可以是原子词,也可以是复合词。词的外延可以是高阶谓词,作为词外延的粒可看作是对一个变量的模糊约束,如命题“小王是年轻的”,模糊粒“年轻”是加在小王年龄上的模糊约束。用词语进行计算有2个最主要的理由:第一,当可得到的信息不够精确从而使数值失之偏颇时,必须进行词计算;第二,当允许利用不精确性、不确定性及部分真值使问题易于处理、获得顽健性、降低求解费用以及能较好地与现实一致时,有利于运用词计算。

基于词计算理论的推理、决策和识别方式是最贴近人类的思维形式来求解问题的,其对复杂系统的信息处理有着广阔的应用前景,并在解决利用自然语言进行模糊推理判断、实现模糊控制以及在语言动力学系统和医疗诊断等应用领域获得了一些成功。

1.3.2 粗糙集模型

波兰科学家Pawlak于1982年提出的粗糙集理论是一种刻画不完整性、不确定性的数学工具,主要解决信息粒在近似方面的问题。它是建立在分类机制基础上处理不精确、不确定与不完全数据的新的数学理论,不需要提供除问题所需集合之外的任何先验信息,仅根据观测数据删除冗余信息。通过比较知识不完整的程度——粗糙度、属性间的依赖性与重要性发现数据间的关系,在不损失信息的前提下提取有用特征、简化信息,为研究不精确、不确定知识的表达、学习、归纳方法等提供了一个有力的数学工具,为智能信息处理提供了有效的处理技术,成为当前机器学习、知识发现等领域的研究热点。

粗糙集理论将知识理解为对数据的划分,将分类理解为在特定空间上的等价关系,而等价关系构成了对该空间的划分。每一个被划分的集合称为粒。粗糙集理论的主要思想是利用已知的知识库,将不精确或不确定的知识用已知的知识库中的知识来近似刻画。

粗糙集理论的核心是将知识与分类联系在一起。在粗糙集理论中,“知识”被认为是一种将现实或抽象的对象进行分类的能力。分类用来产生概念,概念则是构成知识的模块。粗糙集理论中的不确定性和模糊性是一种基于边界的概念,即一个模糊的概念具有模糊的边界。

在粗糙集中,人们经常利用知识约简,在保证不丢失知识库有效信息的前提下,消除知识库中的冗余分类或冗余范畴。完成知识约简的基本工作是利用“约简”和“核”这2个概念进行的。核是表达知识必不可少的重要属性集。可以看出,核的概念有2个目的:首先,它可以作为所有简化的计算基础,因为核包含在所有的简化之中,且计算可以直接进行;其次,核是在知识约简时不能消去的知识特征的集合。

粗糙集理论不需要提供问题所需处理的数据集合之外的任何先验信息,对问题不确定性的描述或处理是比较客观的。由于这个理论未包含处理不精确或不确定原始数据的机制,因此其与概率论、模糊数学和证据理论等其他处理不确定或不精确问题的理论有很强的互补性。目前,粗糙集理论已被广泛应用于神经网络、数据挖掘、系统分析、二进制粒算法等领域。

1.3.3 商空间理论模型

张钹等[8]在研究问题求解时提出了商空间理论。该模型基于这样的哲学思想,即“人类智能的公认特点,就是人们能从极不相同的粒度上观察和分析同一问题。人们不仅能在不同粒度的世界上进行问题求解,还能够很快地从一个粒度世界跳到另一个粒度世界,往返自如,毫无困难。这种处理不同粒度世界的能力,正是人类对于问题求解能力强有力的表现”。商空间粒度理论是关于复杂问题求解的空间关系理论,其主要内容包括复杂问题的商空间描述、商空间的粒计算、粒度空间关系的推理等。商空间理论已被成功应用于时间表安排、空间路径规划、遥感图像处理和模式识别等领域。

张钹等又将模糊集合论引入商空间,利用模糊等价关系实现了商空间模型的推广。模糊商空间理论能够更好地反映人类处理不确定问题的若干特点,即信息的确定与不确定、概念的清晰与模糊都是相对的,其都与问题的粒度粗细有关。因此,构造合理的分层递阶的粒度结构,可以高效地求解问题和处理信息。另一方面,商空间理论同样缺少实现粒度之间、粒度世界之间等转换的手段和技术方法。

1.3.4 从粒计算分析三者之间的关系

词计算理论、粗糙集理论和商空间理论都是粒计算这把“大伞”下具体的粒计算模型,而且它们都是在集合论这个大框架下讨论粒计算的,即它们都把粒看作论域的子集。这三者不是相互排斥的,而是侧重点各有不同而已。下面,简单地讨论三者之间的联系。

(1)从人工智能的角度来看

三者都是从各自研究的角度阐述了对人类智能的理解,虽然表述不尽相同,但是都体现了粒计算的基本思想。一方面,人们在求解复杂问题时,可以将其划分为一系列更容易管理和更小的子问题,并在这些子问题上进行求解,从而降低问题求解的复杂度。另一方面,在实际应用中,人们所获得的信息是不完全的、不确定的或模糊的,要想完全区分不同元素是很困难的,而且精确解的代价也很高。因此,为了提高问题求解的效率,需要选择适当的粒度,忽略无关紧要的细节,缩小对问题解的搜索范围。

(2)从粒度的模型来看

虽然三者都是描述人类按照不同粒度处理事物能力的模型,然而商空间理论和粗糙集理论认为“概念用集合来表示”,即不同粒度的概念可以用不同大小的子集来表示,所有这些表示又可以用等价关系来描述。而词计算理论认为“概念用词来表示”,而描述“词”的有效方法就是模糊集合论。

(3)从粒度的表示来看

三者都是将所讨论的对象的集合构成论域,然后通过子集来描述粒。商空间理论、粗糙集理论认为概念可以用子集来表示,不同粒度的概念可以用不同大小的子集来表示,所有这些表示可以用等价关系来描述。一个等价关系对应一个粒,它们的粒可定义为:

粗糙集主要是以GR中的元素即等价类作为研究对象,商空间则是以宏观粒作为研究对象。

Zadeh认为,概念用“词”来表示,而描述“词”的有效方法就是模糊集理论。设X为论域U上任意一个非空符号子集,则X中的任一有限或无限的元素组成的字符串都对应于X的一个词,可见词可以用集合来表示,只是此时的粒定义为G={X|X isr R},其按照约束R的类型进行分类。

(4)从研究的对象粒来看

虽然粗糙集与商空间都是利用等价类来描述粒,利用粒来描述概念,但二者的侧重点有所不同。粗糙集理论是通过元素的不同属性值来描述元素之间的关系,即按照不同属性进行元素分类来表示不同的概念粒度对象。粗糙集理论主要研究概念的表示、刻画及粒与概念之间的依存关系。商空间理论的本质是对(X,f,T)采用分层递阶方法,其着重点在于通过模型转换来构造不同的粒度空间,进而研究不同粒度空间之间的相互转换、相互依存的关系,是描述空间关系学的理论。

然而,从Zadeh的观点来看,前两者所讨论的都是清晰的粒计算,而词计算则是模糊的粒计算,不同的词就表示不同的粒度。词计算理论主要研究如何描述由词界定的不同粒度的对象,它更擅长描述形容词、副词等表达的不同粒度的概念,如非常好、很好等。因为这些词有程度上的不同,所以在一定意义上,虽然词计算理论给出了描述元素之间的关系,但只限于由属性的强弱程度不同所形成的关系。

总之,商空间的求解过程是在“由所有商空间组成的半序格”中运动转换的过程,故可看作宏观的粒计算,而粗糙集理论是在给定的商空间中的运动,故可看作微观的粒计算。由于两者都建立在等价关系之上,因此可以将两者结合起来以便得到更为有效的粒计算工具。从理论上说,若对商空间理论和粗糙集理论进行模糊化,即在它们的模型上引入模糊的概念,则分别提出了模糊商空间理论和模糊粗糙集理论。

由以上对比可以看出,词计算理论是从微观的角度研究词的推理,粗糙集理论是从微观的角度研究属性的约简,而商空间理论是从宏观的角度研究粒度的变化规律。这3个不同的粒计算理论,从思考问题的出发点到解决问题的任务等都不尽相同,但是三者都有一个共同的特点,那就是都考虑到人类智能中有从不同粒度思考问题的这一特点。如何将三者的优点结合起来,形成更强有力的粒计算的方法和理论,是今后一个重要的研究课题。