一定个数事件发生的概率上界估计

Sep 28, 2018·
Yi Zhuang
Yi Zhuang
· 5 min read
blog

已知:事件 A1, …, An 发生的概率分别为 p1, …, pn。记 p = p1 + · · · + pn

求证:至少有 k 个事件发生的概率不大于 pk/k!

一道习题

已知:

事件$A_1,...,A_n$发生的概率分别为$p_1,...,p_n$。 记$p=p_1+\dots+p_n$

求证:至少有$k$个事件发生的概率不大于$p^k/k!$

想法

看到题目的第一感觉,就是类似于二项分布。但仔细考虑一下会发现困难有不少。 如果严格按照题目的要求来,大致是这样的结构:

先算刚好有$k$个事件发生的概率,是一个有$C_n^k$项的求和,求和的每一项具有 $p_{i_1}\cdots p_{i_k}(1-p_{i_{k+1}})\cdots(1-p_{i_n})$的形式,其中 $i_1,\dots,i_k$是$1$到$n$中选出$k$个数,$i_{k+1},\dots i_n$是剩余的数。

然后要算刚好有$k+1,\dots,n$个事件发生的概率。这又是一层求和。这样一个 式子,由于$p_1,\dots,p_n$都是未知的,因此几乎做不了什么化简工作。

好在此题的关键是要求的是一个不等式。因此我们再回过头来看看有什么地方可 以刨去一些使得运算变得复杂的细节。

对于求和的内部,看到最后的结果是只含有$p$的表达式,而上面的式子是连乘式。 想到了均值不等式,但是符号不对,得想其他办法。

再看外部的两层求和,若是能减少一层将会大大方便。这要从解题逻辑上考虑。 再来看看要求:至少发生$k$个事件。那么如果就直接选出$k$个事件让它发生, 剩下的就干脆不管,会怎样呢?

乍看起来好像没什么问题,但考虑一下就会发现存在重复的问题,即概率会变大。 不过本来就是要做概率的放大,因此可以尝试一下。这样,放大后的式子为

$$\sum{p_{i_1}\cdots p_{i_k}}$$

平均的思想

想一想上式的求和过程。既然最后结果是和每个具体事件的概率无关,那么肯定是求出这个式子的最大值,然后说明最大值不大于题目给的值。可以发现,这又是一个"和为定值,求表达式最值"的分配问题。看起来很棘手,但是我们可以猜当概率$p$被平均分配的时候表达式的值是最大的。

下一个问题是,到底是被$k$个事件平均分配,还是$n$个事件平均分配?并且应该怎么证明此时是最大值?我们来推演一下。

如果是被$k$个事件平均分配,虽然这不可能(因为不可能每个事件都有$p/k$的概率),但是证明是最大值比较方便。如果$p_{i_1}+\cdots+p_{i_k}$概率大小不足$p$,那么肯定不是最大值,因为有增大的空间;如果等于$p$,由均值不等式就可以明白平均分配时值最大。那么,这样放缩能不能证出原命题呢?

尝试一下。内部连乘式化为$p^k/k^k$,是一个与求和无关的常数。因此得到的答案为$C_n^kp^k/k^k$。和题目要求比较,要证明$n!\leq (n-k)!k^k$。代了几个具体的$k$后发现不对,说明放的太大了。

如果被$n$个事件平均分配,先看看能不能证出结论。类似地,此时得到的答案为$C_n^kp^k/n^k$。和题目要求比,要证明$n!\leq (n-k)!n^k$。注意到$n^k>n(n-1)\cdots(n-k+1)$,这个放缩刚刚好。

那么接下去试图证明被$n$个事件平均分配时是最大值,这个要难一些。但是这类问题,都可以考虑用调整法。

调整法证明最值

用调整法证明最大值,就是要说明在某个情况下,对参数进行任何满足约束的调整都会使得表达式的值变小。而各种调整又可以进行分解,即只需证明最小操作——对某两个参数进行满足约束的调整使得表达式的值变小即可。

在这里,约束是概率之和为$p$。我们假设在每个事件发生的概率都为$p/n$的情况下表达式值最大,为

$$ \frac{C_n^kp^k}{n^k}$$

接着为满足约束条件,对两个事件的概率引入小扰动,使其发生的概率分别变为$p/n-t$和$p/n+t$。此时表达式的值为

$$\frac{C_{n-2}^kp^k}{n^k}+\frac{C_{n-2}^{k-1}p^{k-1}}{n^{k-1}}(\frac{p}{n}-t)+\frac{C_{n-2}^{k-1}p^{k-1}}{n^{k-1}}(\frac{p}{n}+t)+\frac{C_{n-2}^{k-2}p^{k-2}}{n^{k-2}}(\frac{p}{n}-t)(\frac{p}{n}+t)$$

上式共有四项,从左至右依次是

  • 从除去两个扰动事件中选$k$个;

  • 从除去两个扰动事件中选$k-1$个并配上概率减小的事件;

  • 从除去两个扰动事件中选$k-1$个并配上概率增大的事件;

  • 从除去两个扰动事件中选$k-2$个并配上两个概率变化的事件;

简单化简后成为

$$ \frac{p^k}{n^k}(C_{n-2}^k+2C_{n-2}^{k-1}+C_{n-2}^{k-2})-t^2\frac{C_{n-2}^{k-2}p^{k-2}}{n^{k-2}}$$

对比一下前一个最大值表达式,容易猜到上式中左项应当就是最大值,而右式带平方的负项正是调整的损益。接下去只需要证明

$$C_{n-2}^k+2C_{n-2}^{k-1}+C_{n-2}^{k-2}=C_n^k$$

即可。事实上,这个直接通分即可验证。

最后,对于$n<2,k<2$的情况,直接单独验证即可。略(其实是懒)。

组合数的一个性质

从形式上看,可以猜到上式是下面这个式子的特殊情况。

$$C_n^k=\sum_{i=0}^m{C_{n-m}^{k-i}C_m^i},m=0,1,\dots,n-k$$

这个式子的代数证法试了一天无果,但是从实际意义上很好理解。

为从$n$个对象中选出$k$个,将其分为两堆。记$A$堆有$m$个,$B$堆有$n-m$个。 总共的种数是以下分配的种数之和:

  • 从$A$堆中取出$0$个,$B$堆中取出$k$个。

  • 从$A$堆中取出$1$个,$B$堆中取出$k-1$个。

  • .......…

  • 从$A$堆中取出$k$个,$B$堆中取出$0$个。

也就是

$$C_n^k=\sum_{i=0}^m{C_m^iC_{n-m}^{k-i}}$$

如果有读者知道该如何从代数角度证明,欢迎联系我。

Yi Zhuang
Authors
PhD student in Meteorology
Yi Zhuang is a PhD student at the Institute of Atmospheric Physics, Chinese Academy of Sciences. His research focuses on the predictability of the Martian atmosphere, numerical modeling, CNOP, and nonlinear dynamics.