位置: 主页 > 产品兴农 >机率空间(3)机率空间(Probability space- >
  • 机率空间(3)机率空间(Probability space-

    2020-07-17

    (3)(Probability space-3. Probability space)

    连结:机率空间(2)机率的意义

    摘要:机率空间是机率论的基础,本篇从集合论出发,介绍Kolmogorov的现代公设观点,并以此定义机率函数(probability function),并条列出机率函数的一些性质。

    众所周知,数学中各领域的起源,通常都是始于解决实际的问题,此时不论专业或业余,很多人都可参与探讨。而后逐渐深入,就只有少数专业人士能理解其中的内涵了。

    以几何学为例,其发源是始于尼罗河氾滥后的测量问题。平面几何学中的诸多美妙结果,两千三百多年前,就已被欧几里得(Euclid,约西元前375-300年),收录于其几何原本(Elements)一书中。当年毕达哥拉斯(Pythagoras,约西元前580-500年)等着名数学家所探讨的问题,不过是今日中学数学课程的内容。而一般人若翻阅大学数学系的几何学教科书,可能不会感觉这是在讲几何的书。

    数学的发展,通常有三个阶段。第一阶段是解决实际问题,此时人们只求将这些问题的解答找出来。但逐渐地,有些人在解决问题之余,也进一步探讨这些问题的本质,也就是建立较一般的系统,而将原有的问题当作此系统下之特例。以排列组合解决一般的机率问题,可视为机率发展的第二阶段。但若未进入第三阶段,机率是无法成为数学中之一主要领域。

    由于起源较晚,直到20世纪,于1933年,年轻的俄国数学家柯莫果洛夫(Andrey N. Kolmogorov,1903-1987),才以公理化的方式来定义机率。经由他所给的几个公理(axiom),可推导出许多结果,因而可对我们所探讨的一些实际问题,有更清晰的概念。当然,也可只是探讨,所谓被称为机率而不用管这些题材与任何实际的问题有关联。

    机率,往昔曾被称为或然率、概率等。如何能以更一般的方式引进,且可包含上节中所给的三种对机率的解释,又具充分的弹性,能让我们推导出一套完整的理论?首先由上一节中,三种对机率的解释,得到启示,定义中必须包含下述三基本要件:

    上述 $$P$$ 即为一个定义在 $$\mathcal{F}$$ 中的取实值之函数。由于定义域 $$\mathcal{F}$$ 中的每一元素皆为{集合函数}(set function)。样本空间、 事件及机率,皆可有如上节中的解释。即 $$\Omega$$ 可视为一观测之所有可能的结果之集合; 一事件 $$A$$ 称为发生,如果观测的结果为 $$A$$ 中的元素; 而 $$P(A)$$ 可视为事件 $$A$$,不论在那种意义下,发生的机率。

    但如前所述,我们也可完全不管,究竟是不是在观测任何随机现象,也就是 $$\Omega$$ 只要是一非空的集合就好。至于对 $$P(A)$$,就是被称为事件 $$A$$ 的一个函数值, 此函数值在我们的讨论里,又被称为事件$$A$$之机率。

    但这并无关紧要,可以不必联想到是不是真有某一个事件发生。这种思维并不奇怪。像是喜欢金庸武侠小说的读者,通常并不会追着金庸问历史上是否真有郭靖及黄蓉等。但金庸小说中的合理性却是读者可以追究的。因此,以公理化的的方式来定义机率,也要能自圆其说,或近一步要求,要天衣无缝。

    但比小说的虚构更实际的是,我们虽以抽象的方式引进机率,但可套进任何实际(或虚拟)的随机现象。也就是一旦叙明,$$\Omega$$ 是观测那一随机现象所得之全部可能的结果之集合,则 $$P(A)$$ 便为一特定事件 $$A$$ 会发生之机率了。

    很多时候(尤其是 $$\Omega$$ 中只有有限多个元素),往往将 $$\mathcal{F}$$ 取成包含 $$\Omega$$ 之所有子集之集合。这样不是简单明了吗? 为什幺在前述三基本要件中,我们却将 $$\mathcal{F}$$ 只取成 $$\Omega$$ 的一些子集所形成之集合?这样的作法,其实是比较一般。

    有如某班要组一啦啦队。可以全班皆参与,也可以只由部分同学组成。但既然是啦啦队,要达到某一程度的演出效果,并玩出够多的花样,人数便不能过少,甚至有可能因多找了一个女生,便要多找一位男生与她配。$$\mathcal{F}$$ 也是一样,因只有 $$\mathcal{F}$$ 中的元素,才称为事件,才给其机率,$$\mathcal{F}$$ 可以很有弹性的找一些 $$\Omega$$ 的子集来组成,但要给定一些规範,使 $$\mathcal{F}$$ 包含够多该有的 $$\Omega$$ 之子集,因此才有够多的理论能发展出来。

    那 $$\mathcal{F}$$ 要满足那些条件呢? 对于二事件 $$A$$,$$B$$(即 $$A,B$$ 皆属于 $$\mathcal{F}$$),有时我们会想知道 $$A$$ 或 $$B$$ 发生(即 $$A\cup B$$ 发生)的机率。有时也会想知道 $$A$$ 与 $$B$$ 同时发生(即 $$A\cap B$$ 发生)的机率。譬如说对世界盃足球赛,有人支持两支球队,他会关心每一支球队赢球的机率($$P(A)$$ 及 $$P(B)$$),也会关心两支中至少有一支赢球的机率($$P(A\cup B)$$),以及两支同时赢球的机率($$P(A\cap B)$$)。对事件 $$A$$ 有兴趣,其不发生(即 $$A$$ 的余集 $$A^c$$ 发生)的机率也很难不想知道。所以 $$\mathcal{F}$$ 应要满足

      若 $$A\in\mathcal{F}$$,则 $$A^c\in\mathcal{F}$$若 $$A,B\in\mathcal{F}$$,则 $$A\cup B\in\mathcal{F}$$,且 $$A\cap B\in\mathcal{F}$$

    由上述条件 (b),立即得

    对 $$\forall n\ge 1$$,若 $$A_1,A_2,\cdots,A_n\in\mathcal{F}$$,

    则 $$\bigcup_{i=1}^{n}A_i=A_1\cup A_2\cup \cdots\cup A_n$$,及 $$\bigcap_{i=1}^{n}A_i=A_1\cap A_2\cap \cdots\cap A_n$$ 皆属于 $$\mathcal{F}$$。

    这只要由 $$A_1\cup A_2\cup A_3=(A_1\cup A_2)\cup A_3$$,$$A_1\cap A_2\cap A_3=(A_1\cap A_2)\cap A_3$$ 便可看出。

    若 $$\Omega$$ 只是一有限的集合,对 $$\mathcal{F}$$ 要求满足条件(a)及(b)便够了。但若 $$\Omega$$ 为一无限集合,只假设条件(a)及(b),却无法导出够多的数学理论。

    数学中常不得不讨论极限,如果有一数列的事件$$A_1,A_2,\cdots$$ 皆属于 $$\mathcal{F}$$,

    则对于 $$\bigcup^\infty_{i=1}A_i=A_1\cup A_2\cup\cdots$$,$$\bigcap^\infty_{i=1}A_i=A_1\cap A_2\cap\cdots$$,
    我们会希望二者皆属于 $$\mathcal{F}$$。

    实际上,由于有狄莫根法则(De Morgan’s laws):对任一数列之集合 $$B_1,B_2,\cdots$$

    $$(1)~~~(\bigcup^\infty_{i=1}B_i)^c=\bigcap^\infty_{i=1}B_i^c$$

    $$(2)~~~(\bigcap^\infty_{i=1}B_i)^c=\bigcup^\infty_{i=1}B_i^c$$

    因此只需要求 $$\cup^\infty_{i=1}A_i$$ 与 $$\cap^\infty_{i=1}A_i$$,两者之一属于 $$\mathcal{F}$$ 即可。

    这是因已有「若 $$A\in\mathcal{F}$$,则 $$A^c\mathcal{F}$$」,故

    $$\bigcap^\infty_{i=1}A_i=(\bigcup^\infty_{i=1}A_i^c)^c$$,$$\bigcup^\infty_{i=1}A_i=(\bigcap^\infty_{i=1}A_i^c)^c$$

    此处分别用到 $$(1)$$ 及 $$(2)$$ 式,以及 $$(A^c)^c=A$$ 等性质。总结如下: 我们要求 $$\mathcal{F}$$ 须满足

      若 $$A\in\mathcal{F}$$,则 $$A^c\mathcal{F}$$若 $$A_1,A_,2,\cdots\in\mathcal{F}$$,则 $$\cup^\infty_{i=1}A_i\in\mathcal{F}$$

    当然我们已指出, 满足(i)及(ii)的 $$\mathcal{F}$$,便亦满足

      若 $$A_1,A_,2,\cdots\in\mathcal{F}$$,则 $$\cap^\infty_{i=1}A_i\in\mathcal{F}$$

    在此波瑞尔(Emile Borel,1871-1956),为着名的法国数学家, 也是现代机率论的创始者之一。

    定义1. 一非空集合 $$K$$ 之一些(至少一个)子集所形成之集合 $$\mathcal{L}$$,称为一 $$\sigma$$-体($$\sigma$$-field,又称 $$\sigma$$-algebra,或 Borel field),若满足

      若 $$B\in\mathcal{L}$$,则 $$B^c\in\mathcal{L}$$若 $$B_1,B_2,\cdots\in\mathcal{L}$$,则 则 $$\cup^\infty_{i=1}B_i\in\mathcal{L}$$

    所以我们就是要求 $$\mathcal{F}$$ 为一 $$\sigma$$-体。

    对于 $$\sigma$$-体 $$\mathcal{F}$$,立即便有 $$\varnothing$$ 及 $$\Omega$$ 皆属于 $$\mathcal{F}$$(因 $$A\cup A^c=\Omega$$,而 $$\Omega^c=\varnothing$$)。

    即 $$\{\varnothing,\Omega\}$$ 为由 $$\Omega$$ 所产生之最小的 $$\sigma$$-体。所谓最小,是指若有其他 $$\sigma$$-体,一定包含这一个。

    而 $$\Omega$$ 所有子集之集合,可视为最大的 $$\sigma$$-体。

    由 $$\mathcal{F}$$ 须满足的条件(ii),立即导致前述条件(b)成立(只要将 $$A_{n+1},A_{n+2},\cdots$$,皆取成 $$\varnothing$$,

    则 $$\bigcup^\infty_{i=1}A_i=\bigcup^n_{i=1}A_i$$);且若 $$\Omega$$ 为一有限集合,则二条件等价。

    现在我们可以定义机率函数(probability function)了。

    定义2. 设 $$\Omega$$ 为一样本空间,$$\mathcal{F}$$ 为 $$\Omega$$ 之一些子集所形成之一 $$\sigma$$-体。则以 $$\mathcal{F}$$ 为定义域,满足下述条件的函数 $$P$$,便称为一机率函数:

      $$\forall A\in\mathcal{F},~P(A)\ge 0$$$$P(\Omega)=1$$若 $$A_1,A_2,\cdots\in\mathcal{F}$$,且 $$A_i\cap A_j=\varnothing,~\forall i\ne j$$,则

    $$(3)~~~P(\bigcup^\infty_{i=1}A_i)=\sum^\infty_{i=1}P(A_i)$$

    对一样本空间 $$\Omega$$, 我们引进了 $$\sigma$$-体 $$\mathcal{F}$$,及机率函数 $$P$$,

    $$(\Omega,\mathcal{F},P)$$ 便构成一机率空间(probability space)。

    定义2中的 $$(3)$$ 条件,通常称为机率的公理或柯莫果洛夫公理(Kolmogorov axioms)。

    对同一样本空间,可以有不同的 $$\sigma$$-体。即使 $$\sigma$$-体相同,也可有不同的机率函数。

    对 $$\forall A\in \mathcal{F}$$,$$A$$ 称为一事件,$$P(A)$$ 称为 $$A$$ 之机率。

    至于若 $$B\subset\Omega$$,而 $$B\not\in\mathcal{F}$$,则 $$B$$ 不为事件,不用知道(事实上也没给)其机率。

    机率空间是机率论的基础。若只是处理一些简单的情况下的机率,则有时不用太在乎所涉及的机率空间究竟是什幺。但在处理较细腻的问题时,有时就得弄清楚机率空间究竟为何。这彷彿对某一个人,有时我们只需要知道他的名字,有时得进一步了解这个人的「出身」,如学经历等。

    为了简便,特别是 $$\Omega$$ 中只有可数的(countable)多之元素时,常将 $$\mathcal{F}$$ 取成 $$\Omega$$ 之所有子集之集合。即使 $$\Omega$$ 是一无限区间,譬如说实数的集合,$$\mathcal{F}$$ 也有一常见的取法。 我们稍后再介绍。在很多实例中,会说明 $$\Omega$$ 及 $$P$$ 各是什幺,却未见到 $$\mathcal{F}$$。此即表 $$\mathcal{F}$$ 是取成常见的 $$\sigma$$-体,因此不用特别提它。

    注1:一集合称为可数的若其为有限,或无限但与正整数集合有一对一且映成的对应(即可表为$$\{a_1,a_2,\cdots\}$$)。

    机率函数有一些基本的性质, 我们列举一些如下。

    定理1. 设 $$(\Omega,\mathcal{F},P)$$ 为一机率空间。则

      $$P(\varnothing)=0$$$$P(A)\le 1,~\forall A\in\mathcal{F}$$$$P(A^c)=1-P(A),~\forall A\in\mathcal{F}$$$$P(A\cup B)=P(A)+P(B)-P(A\cap B),~\forall A,B\in\mathcal{F}$$$$P(A\cap B)\ge P(A)+P(B)-1,~\forall A,B\in\mathcal{F}$$设 $$C_1,C_2,\cdots \in\mathcal{F},~C_i\cap C_j=\varnothing,~\forall i\ne j$$,且 $$\cup^{\infty}_{i=1}C_i=\Omega$$,则

    $$(4)~~~P(A)=\sum_{i=1}^{\infty}P(A\cap C_i),~\forall A\in\mathcal{F}$$

      对任意 $$A_1,A_2,\cdots \in \mathcal{F}$$

    $$(5)~~~P(\bigcup_{i=1}^{\infty}A_i)\le \sum_{i=1}^{\infty}P(A_i)$$

    在定理1中之(vi),满足所列条件之 $$C_1,C_2,\cdots$$,称为 $$\Omega$$ 之一分割(partition)。

    事件 $$A_1,A_2,\cdots$$(有限个亦可),若满足 $$A_i\cap A_j=\varnothing,~\forall i\neq j$$,便称为每对互斥(pairwise disjoint)。至于若 $$A,B\in\mathcal{F}$$,且 $$A\cap B=\varnothing$$,便称 $$A$$ 与 $$B$$ 互斥(disjoint)。

    $$(5)$$ 式即为波尔不等式(Boole’s inequality)。波尔(George Boole,1815-1864)为英国数学家。

    机率函数尚有许多其他的性质, 此处暂且列下不表。不过一个看起来要求并不太多的公理化的系统,就引发出许多有趣且值得探讨的理论,且应用广泛。自柯莫果洛夫之后,机率论便逐渐为数学家所接受。时至今日,机率论已成为数学中一重要的领域,可与那些传统的代数、分析及几何等领域分庭抗礼了。

    连结:机率空间(4)机率空间之例

    参考资料:



    上一篇: 下一篇: