人工智能导论【二】

三、知识表示


1、知识的基本概念

(1)知识的定义

知识是人们在长期的生活及社会实践中积累起来的对客观世界的认识与经验,认识客观世界的前提是能对其描述,而描述由数据和信息来实现的.

  • 获取:人们把实践中获得的信息关联(即加工和有序化)在一起,就获得了知识。
  • 认识:包括对事物现象、本质、属性、状态、关系、联系和运动等的认识。

  • 经验:包括解决问题的微观方法,如步骤、操作、规则、过程、技巧等;宏观方法,如战略、战术、计谋、策略等。

信息:信息是伴随着宇宙的形成而产生的,是客观存在的,它普遍存在于自然界、人类社会及思维活动中。它是客观世界中各种事物变化和特征的反映,是对客观事物的一般性描述。

数据:用一组符号及其组合表示,泛指对客观事物的数量、属性、位置及其相互关系的抽象表示。

数据与信息的关系:数据是信息的载体,本身无确切含义,其关联构成信息;信息是数据的关联,赋予数据特定的含义。

最终我们得到知识的定义:把有关信息关联在一起所形成的信息结构称为知识。

信息之间关联的形式可以多种多样,最常见的一种形式是因果关系。

知识分为:规则、事实。

(2)知识的特性

1、相对正确性

  • 真假性:可以通过实践和推理来证明知识是真的还是假的
  • 相对性:非绝对性。知识的真与假是相对于条件、环境、事件而言的。

2、不确定性

  • 由随机性引起的不确定性
  • 由模糊性引起的不确定性
  • 由不完全性引起的不确定性
  • 由经验引起的不确定性

3、可表示性与可利用性

  • 可表示性:知识可用适当的形式表示出来。如:语言、文字、图形、神经网络等,所以它才得以被存储并被传播;
  • 可利用性:用知识解决所面临的各种各样的问题。

(3)知识的分类

1、从作用范围可分为

  • 常识性知识:是人们普遍知道的知识,适用于所有领域。
  • 领域性知识:是面向某个具体领域的知识,是专业性的知识,只有相应专业的人员才能掌握并用来求解领域内的有关问题。专家系统拥有的是此类知识。

2、按知识的确定性可分为

  • 确定性知识:可以指出其值为“真”或“假”的知识,是精确性的知识。
  • 不确定性知识:指具有“不确定”特性的知识,它是对不精确、不完全及模糊性知识的总称。

3、按知识的作用及表示可分为

  • 事实性知识:(就是真理)用于描述领域内有关概念、事实、事物的属性及状态等。
    • 事实性知识一般采用直接表达的形式,如用谓词公式表示等。
  • 过程性知识:主要指领域知识,用于指出如何处理与问题相关的信息以求得问题的解,由领域内的规则、定律、定理及经验构成。
    • 过程性知识表示方法既可以是一组产生式规则,也可以是语义网络等。
  • 控制性知识:又称深层知识或元知识,是关于如何运用已有的知识进行问题求解的知识,又称“关于知识的知识”。
    • 例如问题求解中的推理策略(正向推理及逆向推理);信息传播策略 (如不确定性的传递算法);搜索策略(广度优先、深度优先、启发式搜索等);求解策略(求第一个解、全部解、严格解、最优解等)。

4、按知识的结构及表现形式可分为

  • 逻辑性知识:反映人类逻辑思维过程的知识,如人类的经验性知识。这种知识一般都有因果关系及难以精确描述的特点,它们通常是基于专家的经验、以及对一些事物的直观感觉。

    • 一阶谓词逻辑表示法,产生式表示法都是用来表示这种知识的。
  • 形象性知识:通过事物的形象建立起来的知识称为形象性知识。

    • 目前人们正在研究利用神经元网络连接机制来表示这种知识。

5、从抽象、整体的观点来分

  • 零级知识:指问题领域内的事实、定律、定理、方程等常识性知识和原理性知识。
  • 一级知识:是指具有经验性、启发性的知识,例如经验性规则、含义模糊的建议、不确切的判断标准等。
  • 二级知识:如何运用上述两级知识的知识。

这种关于知识的层次划分还可以继续下去,每一级知识都对其低一层的知识有指导意义。在实际应用中,通常把零级知识与一级知识统称为领域知识,而把二级以上的知识统称为元知识。

(3)知识的表示

语言和文字是人们表达思想交流信息的工具。计算机领域的二进制、字符串、高级语言;数学领域的各种符号;化学领域的方程式等等,都是表示的语言。

定义:所谓知识表示实际上就是对知识的一种描述,或者说是一组约定,一种计算机可以接受的用于描述知识的数据结构。对知识进行表示的过程就是用一组符号把知识编码成计算机可以 接受的某种数据结构的过程。

知识表示方法又称为知识表示技术,其表示形式称为知识表示模式。

知识的表示方法可分为:符号表示法(本课程主要讨论)、连接机制表示法

按控制性知识的组织方式分类,知识的表示方法可分为:

  • 说明性表示法:说明性表示法着重于知识的静态方面,如客体、事件、事实及其相互关系和状态等,其控制性知识包含在控制系统中。

  • 过程性表示法:过程性表示法强调的是对知识的利用,着重于知识的动态方面,其控制性知识全部嵌入于对知识的描述中,且将知识包含在若干过程中。

目前用得较多的知识表示方法主要有:一阶谓词逻辑表示法、产生式表示法、框架表示法、语义网络表示法、脚本表示法、过程表示法、Petri 网表示法、面向对象表示法

不同的领域知识的表示形式各有不同,在建立一个具体的智能系统时采用哪种模式,并没有统一的标准,但是基本上遵循如下的要求:

  • 充分表示领域知识
  • 有利于对知识的利用
  • 便于对知识的组织、维护与管理
  • 便于理解和实现

(4)知识的一阶谓词逻辑表示法

2、产生式的知识表示法

(1)产生式的基本形式-事实的表示

事实的定义:事实是断言一个语言变量的值或断言多个语言变量之间关系的陈述句。

  • 事实:“雪是白色的”

    • *语言变量:雪 *
    • 语言变量的值:白色的
  • 事实:“王峰热爱祖国”

    • *语言变量:王峰 祖国 *
    • 语言变量之间的关系:热爱

确定性事实知识的表示:三元组(对象,属性,值)或(关系,对象1,对象2)其中,对象就是语言变量。

  • 雪是白色的:(Snow,Color,White) 或(雪,颜色,白)

  • 王峰热爱祖国: (Love,WangFeng,Country) 或(热爱,王峰,祖国)

不确定性事实知识的表示:四元组 (对象,属性,值,可信度)或(关系,对象1,对象2,可信度

  • 事实“老李年龄很可能是45岁。”可表示为:(Li,Age,45,0.8)
  • 事实“老李、老张不大可能是朋友。”可表示为:(Friend,Li,Zhang,0.1)

(2)产生式的基本形式-规则的表示

规则的作用:描述事物之间的因果关系。

确定性规则知识的产生式表示:基本形式:*P→Q 或 IF P THEN Q *

  • P是产生式的前提,用于指出该产生式是否可用的条件;

  • Q是一组结论或操作,用于指出当前提P所指示的条件被满足时,应该得出的结论和应该执行的操作。

    整个产生式的含义是:如果前提P所指示的条件被满足时,则可得出结论Q或者执行Q所规定的操作。

不确定性规则知识的产生式表示:基本形式:P→Q (置信度)或 IF P THEN Q (置信度)

  • IF 动物有犬齿 AND 有爪 AND 眼盯前方 THEN 该动物是食肉动物
  • IF 本生物的染色斑是革兰氏阴性, 本微生物的形状呈杆状, 病人是中间宿主 THEN 该微生物是绿脓杆菌,置信度为 0.6

谓词逻辑中的蕴含式与产生式的基本形式有相同的形式,其实蕴含式只是产生式的一种特殊情况。

第一个区别是:在值上,一个是精确的,一个是不精确的。

第二个区别是:前者在匹配上,是精确的匹配;后者可以精确匹配也可以精确匹配也可以模糊匹配。

产生式 vs.计算机程序语言中的条件语句

  • 1.前提结构不同
    • 产生式的前件可以是一个复杂的的结构
    • 传统程序设计语言中的左部仅仅是一个布尔表达式
  • 2.控制流程不同
    • 产生式系统中满足前提条件的规则被激活后,不一定被立即 执行,能否执行将取决于冲突消解策略
    • 传统程序设计语言中是严格地从一个条件语句向其下一个条件语句传递

产生式的严格描述:巴科斯范式BNF(Backus Normal Form)

(3)产生式系统

产生式系统:把一组产生式放在一起,让他们互相配合,协同作用,一个产生式生成的结论可以供另一个产生式作为已知事实使用,以求得问题的解决,这样的系统称为产生式系统。

一个产生式系统一般由三个基本部分组成:

  • 规则库(RB: Rule Base):用于描述相应领域内知识的产生式集合称为规则库。
  • 综合数据库(DB: Data Base):综合数据库系统又称为事实库、上下文、黑板等。它是一个用于存放问题求解过程中各种当前信息的数据结构。综合数据库的内容是在不断变化的,是动态的
    • 综合数据库的作用:
    • ①存放求解问题的各种当前信息
    • ②用于推理过程的规则匹配
  • 控制系统:控制系统又称为推理机构,由一组程序组成,是规则的解释程序,负责整个产生式系统的运行,决定问题求解过程的推理线路,实现对问题的求解。通俗的讲,控制系统就是怎样去组织知识、证据、事实等信息,并最终获取一个确定的结论的过程。
    • 控制系统的主要工作:
    • 匹配:按一定策略从规则库中选择规则与综合数据库中的已知事实进行匹配。
    • 冲突消解:匹配成功的规则可能不止一条,这称为发生了冲突。此时,控制系统必须调用相应的解决冲突的策略进行消解,以便从中选出一条执行。
    • 处理结论或执行操作:在执行某一条规则时,如果该规则的右部是一个或多个结论,则把这些结论加入到综合数据库中;如果该规则的右部是一个或多个操作,则执行这些操作。
    • 计算不确定性:对于不确定性知识,在执行每一条规则时还要按照一定算法计算结论的不确定性。
    • 随时掌握结束产生式系统运行的时机,以便在适当的时候停止系统的运行。

产生式系统的分类

  • 按推理方向

    • 前向产生式系统
    • 向产生式系统
    • 双向产生式系统
  • 按所表示知识是否具有确定性

    • 确定性产生式系统
    • 不确定性产生式系统
  • 按规则及综合数据库的性质及结构特征进行分类

    • 可交换的产生式系统
    • 可分解的产生式系统
    • 可恢复的产生式系统

产生式的缺点

  • 效率不高,求解问题的过程是一个反复进行“匹配-冲突消解-执行”的过程。
  • 不能表达具有结构性的知识

农夫过河问题

农夫、公鸡、小狗、白菜全部放在一条河的左岸,现在要把他们全部送到河的右岸去。农夫有一条船:

•船很小,农夫一次只能带一样东西过河;

•如果没有农夫看管,小狗会与公鸡打架,公鸡会吃白菜;

•每次过河必须有农夫,因为只有农夫可以划船。

a)请规划出一个确保全部安全过河的计划,并用一阶谓词逻辑表示该问题的求解?

b)请用产生式表达式表示过河的规则。

详解见P20

3、框架知识表示

框架实际上就是一种表示的数据结构。具有继承性,求解问题的时候通过不断匹配属性来达到目的。

比起产生式来,框架比较少用。它不善于表达过程性的知识。善于表达结构性知识

一些系统预定义槽名:

  • ISA:是一个
  • AKO:是一种
  • Subclass:是….的子类
  • Instance:实例
  • Part-of:部分
  • Infer:推出
  • Possible-Reason:其作用与Infer槽作用相反,它用来把某个结论与可能的原因联系起来。

下层框架的槽:ISA、AKO、Subclass

上层框架的槽:Instance

Part-of是横向槽不属于继承关系

Infer表示能够推出的

4、语义网络表示法

语义网络是通过概念及其语义关系来表达知识的一种网络图。

从图论的观点看,语义网络是一个“带标识的有向图”。

语义网络对量化变量的处理:

  • 存在量词:可以直接用“是一个”、“是一种”等这样的语义关系起来。
  • 全称量词: 需用网络分区技术实现。

常用的语义关系

  • 定义在框架中的ISA、AKO、Infer也可用于语义关系
  • A-Member-of联系
  • Composed–of联系
  • Have联系
  • Before, After, At 联系
-----------------------本文结束 感谢阅读-----------------------
坚持原创技术分享,您的支持将鼓励我继续创作!恰饭^.^~