例
假设有一个袋子,里面有两枚硬币:
- Coin A (Fair): 正反面概率各为 。
- Coin B (Biased): 正面概率为 ,反面为 。
随机抓出一枚硬币,但不知道是哪一枚。此时你的先验概率(Prior是:
贝叶斯网络结构这个简单的网络只有两个节点:
- 节点 H (Hypothesis): 选中的是哪枚硬币(A 或 B)。
- 节点 O (Observation): 投掷的结果(正面 Heads 或 反面 Tails)。
- 关系: (硬币的种类决定了投出结果的概率分布)。
更新过程(贝叶斯推断)如果你投了一次硬币,结果是 正面 (Heads)。我们要更新对“抓到的是 Coin B”的看法。
第一步:计算似然度 (Likelihood)如果它是 A,投出正面的概率:如果它是 B,投出正面的概率:
第二步:应用贝叶斯公式更新其中, 是全概率:计算后验概率:
结论: 看到正面后,你对“这枚硬币是 B(偏心硬币)”的信心从 上升到了 。
形式化描述
形式化描述 (Formal Description)贝叶斯网络(Bayesian Network, BN)是一个有向无环图(DAG),由三元组 定义:
- 结构定义节点 ():每个节点 代表一个随机变量。
- 边 ():有向边 表示变量间的直接因果关系或依赖关系, 被称为 的父节点(Parents),记作 。
- 因子分解 (Factorization):联合概率分布可以分解为局部条件概率的乘积: 贝叶斯网络依赖的是局部马尔可夫性质(Local Markov Property):“给定父节点,该节点独立于所有非后代节点”。即:。 公式里的随机变量已经经过了拓扑排序,越靠前越是祖先。
参数定义 ()每个节点 都关联一个条件概率表 (CPT),定义了在父节点取不同值时, 的概率分布 .
推断与更新 (Inference & Update)当观测到部分变量的证据 (Evidence)(e是某个节点所代表的随机变量的观测值)时,我们关注目标变量 的后验分布。根据贝叶斯准则:其中 被称为证据因子 (Evidence/Marginal Likelihood),起归一化作用。
需要更新的节点
证据节点的子孙,不更新子孙的祖先。
证据节点的祖先,祖先的子孙。