贝氏网络(Bayesian network),又称信任网络(belief network)或是有向非循环图形模型(directed acyclic graphical model),是一种机率图型模型,借由有向非循环图形(directed acyclic graphs, or DAGs )中得知一组随机变量{X1,X2,...,Xn}及其n组条件机率分配(conditional probability distributions, or CPDs)性质。举例而言,贝氏网络可用来表示疾病和其相关症状间的机率关系;假若已知某种症状下,贝氏网络就可用来计算各种可能罹患的疾病之发生机率。
在一般情况下,贝氏网络的有向非循环图形中的节点表示随机变量,他们可以是可观察到的变量,抑或是潜在变量、未知参数等。连接两个节点的箭头代表此两个随机变量是具有因果关系或是非条件独立的;而节点中变量间若没有箭头相互连接一起的情况就称其随机变量彼此间为条件独立。若两个节点间以一个单箭头连接在一起,表示其中一个节点是“因(parents)”,另一个是“果(descendants or children)”,两节点就会产生一个条件机率值。比方说,我们以Xi表示第i个节点,而Xi的“因”以Pi表示,Xi的“果”以Ci表示;图一就是一种典型的贝氏网络结构图,依照先前的定义,我们就可以轻易的从图一可以得知
大部分的情况下,贝氏网络适用在节点的性质是属于离散型的情况下,且依照Pr(Xi | Pi)此条件机率写出条件机率表(conditional probability table, or CPT),此条件机率表的每一列(row)列出所有可能发生的Pi,每一行(column)列出所有可能发生的Xi,且任一列的机率总和必为1。写出条件机率表后就很容易将事情给条理化,且轻易地得知此贝氏网络结构图中各节点间之因果关系;但是条件机率表也有其缺点:若是节点Xi是由很多的“因”所造成的“果”,如此条件机率表就会变得在计算上既复杂又使用不便。
数学定义
令G = (I,E)表示一个有向非循环图形(DAG),且令X = (Xi)i ∈ I为其有向非循环图形中的某一节点i所代表之随机变量,若节点X的联合机率分配可以表示成:
则称X为相对于一有向非循环图形G 的贝氏网络,其中pa(i)表示节点i之“因”。 对任意的随机变量,其联合分配可由各自的局部条件机率分配相乘而得出:
依照上式,我们可以将一贝氏网络的联合机率分配写成:
对每个相对于Xi的“因”变量Xj 而言)上面两个表示式差别在于条件机率的部分,在贝氏网络中,若已知其“因”变量下,某些节点会与其“因”变量条件独立,只有与“因”变量有关的节点才会有条件机率的存在。
例子一(已知机率)
假设有两种事件会造成草地潮湿(以’G’表示之):洒水器(以’S’表示之)与下雨(以’R’表示之);且假设有无下雨亦会是造成洒水器是否运转的直接因素(亦即若有下雨则洒水器在大部份的情况下就不会再运转),则此贝氏网络的结构图可以表示成如图二的型式。所有三个变量皆只有两种可能值:T( true) 或 F( false)。则此联合机率分配可以表示成: