概率论
维基百科,自由的百科全书
機率論或概率論是研究隨機性或不確定性等現象的數學。更精確地說,機率論是用來模擬實驗在同一環境下會產生不同結果的情狀。典型的随机實验有掷骰子、扔硬币、抽扑克牌以及輪盤游戏等。
數學家和精算師認為機率是在0至1之間之閉區間的數字,指定給一發生與失敗是隨機的「事件」。機率P(A)根據機率公理來指定給事件A。
一事件A在一事件B確定發生後會發生的機率稱為B給之A的條件機率;其數值為(當P(B)不等於零時)。若B給之A的條件機率和A的機率相同時,則稱A和B為獨立事件。且A和B的此一關係為對稱的,這可以由一同價敘述:「,當A和B為獨立事件時。」中看出。
機率論中的兩個重要概念為隨機變數和隨機變數之機率分佈這兩種概念;更多訊息,可參見其條目。
目录 |
[编辑] 生活例子
普遍認為,人們對將要發生的機率總有一種不好的感覺,或者說不安全感,俗稱「點背」,下面列出的幾個例子可以形象描述人們有時對機率存在的錯誤的認識:
- 六合彩:在六合彩(49選6)中,一共有13983816種可能性(參閱組合數學),普遍認為,如果每周都買一個不相同的號,最晚可以在13983816/52(周)=268919年後獲得頭等獎。事實上這種理解是錯誤的,因為每次中獎的機率是相等的,中獎的可能性並不會因為時間的推移而變大。
- 生日悖論:在一個足球場上有23個人(2×11個運動員和1個裁判員),不可思議的是,在這23人當中至少有兩個人的生日是在同一天的機率要大於50%。
- 輪盤遊戲:在遊戲中玩家普遍認為,在連續出現多次紅色後,出現黑色的機率會越來越大。這種判斷也是錯誤的,即出現黑色的機率每次是相等的,因為球本身並沒有「記憶」,它不會意識到以前都發生了什麼,其機率始終是 18/37。
- 三門問題:在電視臺舉辦的猜隱藏在門後面的汽車的遊戲節目中,在參賽者的對面有三扇關閉的門,其中只有一扇門的後面有一輛汽車,其它兩扇門後是山羊。遊戲規則是,參賽者先選擇一扇他認為其後面有汽車的門,但是這扇門仍保持關閉狀態,緊接著主持人打開沒有被參賽者選擇的另外兩扇門中後面有山羊的一扇門,這時主持人問參賽者,要不要改變主意,選擇另一扇門,以使得贏得汽車的機率更大一些?正確結果是,如果此時參賽者改變主意而選擇另一扇關閉著的門,他贏得汽車的機率會增加一倍。
[编辑] 历史
作为数学统计基础的概率论的创始人分别是法国数学家帕斯卡和费马,其可追溯到公元 17 世纪。当时的法国宫廷贵族里盛行着掷骰子游戏,游戏规则是玩家连续掷 4 次骰子,如果其中没有 6 点出现,玩家赢,如果出现一次 6 点,则庄家(相当于现在的赌场)赢。按照这一游戏规则,从长期来看,庄家扮演赢家的角色,而玩家大部分时间是输家,因为庄家总是要靠此为生的,因此当时人们也就接受了这种现象。
后来为了使游戏更刺激,游戏规则发生了些许变化,玩家这回用 2 个骰子连续掷 24 次,不同时出现 2 个 6 点,玩家赢,否则庄家赢。当时人们普遍认为,2 次出现 6 点的概率是一次出现 6 点的概率的 1 / 6 ,因此 6 倍于前一种规则的次数,也既是 24 次赢或输的概率与以前是相等的。然而事实却刚好相反,从长期来看,这回庄家处于输家的状态,于是他们去请教当时的数学家帕斯卡,求助其对这种现象作出解释。
其他对概率论的发展作出重要贡献的人还有荷兰物理、数学家惠更斯,瑞士物理、数学家伯努利,法国数学家美弗,法国数学、天文学家拉普拉斯,德国数学家高斯,法国物理、数学家泊松,意大利数学、医学家卡尔达诺以及苏联数学家柯爾莫哥洛夫。
[编辑] 事件
[编辑] 单位事件、事件空间、随机事件
在一次随机试验中可能发生的唯一的,且相互之间独立的结果被成为单位事件,用 e 表示。在随机试验中可能发生的所有单位事件的集合称为事件空间,用 S 来表示。例如在一次掷骰子的随机试验中,如果用获得的点数来表示单位事件,那么一共可能出现 6 个单位事件,则事件空间可以表示为 S = { 1,2, 3, 4, 5, 6 } 。
上面的事件空间是由可数有限单位事件组成,事实上还存在着由可数无限以及不可数单位事件组成的事件空间,比如在一次直到获得国徽面朝上的随机掷硬币试验中,其事件空间由可数无限单位事件组成,表示为:S = } 国,数国,数数国,数数数国,数数数数国,···},注意到在这个例子中"数数数国"是单位事件。将两根筷子随意扔向桌面,其静止后所形成的交角假设为 α,这个随机试验的事件空间的组成可以表示为 S = { α | 0≤ α < 180 } 。
随机事件是事件空间 S 的子集,它由事件空间 S 中的单位元素构成,用大写字母 A,B,C... 表示。例如在掷两个骰子的随机试验中,设随机事件 A = "获得的点数和大于 10 ",则 A 可以由下面 3 个单位事件组成:A = { ( 5,6 ),( 6,5 ),( 6,6 ) } 。
如果在随机试验中事件空间中的所有可能的单位事件都发生,这个事件被称为 必然事件,表示为 S ⊂ S ;相应的如果事件空间里不包含任何一个单位事件,则称之为不可能事件,表示为 ∅ ⊂ S 。
[编辑] 事件的计算
因为事件在一定程度上是以集合的含义定义的,因此可以把集合计算方法直接应用于事件的计算,也就是说,在计算过程中,可以把事件当作集合来对待。
A 的补集 不属于 A 的事件发生 |
聯集 A ∪ B 或者A 或者 B 或者 A,B 同时发生 |
交集 A ∩ B 事件 A,B 同时发生 |
差集 A \ B 不属于 B 的 A 事件发生 |
空集 A ∩ B = ∅ A,B 事件不同时发生 |
子集 B ⊆ A 如 B 发生,则 A 也一定发生 |
在轮盘游戏中假设 A 代表事件「球落在红色区域」,B 代表事件"球落在黑色区域",因为事件 A 和 B 没有共同的单位事件,因此可表示为
注意到事件 A 和 B 并不是互补的关系,因为在整个事件空间 S 中还有一个单位事件「零」,其即不是红色也不是黑色,而是绿色,因此 A,B 的补集应该分别表示如下:
[编辑] 概率的定义
[编辑] 传统概率 ( 拉普拉斯概率 )
传统概率的定义是由法国数学家拉普拉斯 ( Laplace ) 提出的。如果一个随机试验所包含的单位事件是有限的,且每个单位事件发生的可能性均相等,则这个随机试验叫做拉普拉斯试验。在拉普拉斯试验中,事件 A 在事件空间 S 中的概率 P(A) 为:
例如,在一次同时掷一个硬币和一个骰子的随机试验中,假设事件 A 为获得国徽面且点数大于 4 ,那么事件 A 的概率应该有如下计算方法:S = { ( 国徽,1 点 ),( 数字,1 点 ),( 国徽,2 点 ),( 数字,2 点 ),( 国徽,3 点 ),( 数字,3 点 ),( 国徽,4 点 ),( 数字,4 点 ),( 国徽,5 点 ),( 数字,5 点 ),( 国徽,6 点 ),( 数字,6 点 ) },A={( 国徽,5 点 ),( 国徽,6 点 )},按照拉普拉斯定义,A 的概率为,
注意到在拉普拉斯试验中存在着若干的疑问,在现实中是否存在着这样一个试验,其单位事件的概率具有精确的相同的概率值,因为我们不知道,硬币以及骰子是否"完美",即骰子制造的是否均匀,其重心是否位于正中心,以及轮盘是否倾向于某一个数字。尽管如此,传统概率在实践中被广泛应用于确定事件的概率值,其理论根据是:如果没有足够的论据来证明一个事件的概率大于另一个事件的概率,那么可以认为这两个事件的概率值相等。
如果仔细观察这个定义会发现拉普拉斯用概率解释了概率,定义中用了"相同的可能性" ( 原文是 également possible )一词,其实指的就是"相同的概率"。这个定义也并没有说出,到底什么是概率,以及如何用数字来确定概率。在现实生活中也有一系列问题,无论如何不能用传统概率定义来解释,比如,人寿保险公司无法确定一个 50 岁的人在下一年将死去的概率等。
[编辑] 统计概率
统计概率是建立在频率理论基础上的,分别由英国逻辑学家约翰 ( John Venn 1834-1923 ) 和奥地利数学家理查德 ( Richard Von Mises 1883-1953 ) 提出,他们认为,获得一个事件的概率值的唯一方法是通过对该事件进行 100 次,1000 次或者甚至 10000 次的前后相互独立的 n 次随机试验,针对每次试验均记录下绝对频率值和相对频率值 hn(A),随着试验次数 n 的增加,会出现如下事实,即相对频率值会趋于稳定,它在一个特定的值上下浮动,也即是说存在着一个极限值 P(A),相对频率值趋向于这个极限值。这个极限值被称为统计概率,表示为:
例如,若想知道在一次掷骰子的随机试验中获得 6 点的概率值可以对其进行 3000 次前后独立的扔掷试验,在每一次试验后记录下出现 6 点的次数,然后通过计算相对频率值可以得到趋向于某一个数的统计概率值。
扔掷数 | 获得 6 点的绝对频率 | 获得 6 点的相对频率 |
---|---|---|
1 | 1 | 1.00000 |
2 | 1 | 0.50000 |
3 | 1 | 0.33333 |
4 | 1 | 0.25000 |
5 | 2 | 0.40000 |
10 | 2 | 0.20000 |
20 | 5 | 0.25000 |
100 | 12 | 0.12000 |
200 | 39 | 0.19500 |
300 | 46 | 0.15333 |
400 | 72 | 0.18000 |
500 | 76 | 0.15200 |
600 | 102 | 0.17000 |
700 | 120 | 0.17143 |
1000 | 170 | 0.17000 |
2000 | 343 | 0.17150 |
3000 | 560 | 0.16867 |
上面提到的这个有关相对频率的经验值又被称为大数定律,是频率理论学家定义概率论的基础。然而没有人可以将骰子无限的扔下去,因此在实践中也就无法有力的证明大数定律,许多来自数学理论的论证至今也没有取得成功。尽管如此,统计概率在今天的实践中具有重要意义,它是数理统计的基础。
[编辑] 概率公理
如果一个函数 P
指定给每一个事件空间 S 中的事件 A 一个实数 P(A),并且其满足下面的 3 个公理,那么函数 P 叫做概率函数,相应的 P(A) 叫做事件 A 的概率。
公理 1:
|
公理 2:
|
公理 3: ,如果
|
不难看出,上述公理适用于包括拉普拉斯概率和统计概率在内的所有概率定义。如果若干事件间的关系是两两空集,那么公理 3 还可以扩展为如下形式:
- 公理 3:
[编辑] 概率的计算
需要提及的是下面将要介绍的 9 个计算概率的定理与上面已经提及的事件的计算没有关系,所有关于概率的定理均由概率的 3 个公理得来,同时适用于包括拉普拉斯概率和统计概率在内的所有概率理论。
[编辑] 定理 1 (互补法则)
与 A 互补事件的概率始终是
- ,
利用互补法则,可以解决下面这个问题,在两次连续旋转的轮盘游戏中,至少有一次是红色的概率是多少?
第一次旋转红色不出现的概率是 19/37 ,按照乘法法则,第二次也不出现红色的概率是 (19/37)2 = 0.2637,因此在这里互补概率就是指在两次连续旋转中至少有一次是红色的概率,
[编辑] 定理 2
不可能事件的概率为零:
证明:
ø 和 S 是互补事件,按照公理 2 有
- P(S)=1,再根据上面的定理 1 得到
[编辑] 定理 3
如果若干事件 A1,A2,...An ∈S 每两两之间是空集关系,那么这些所有事件集合的概率等于单个事件的概率的和。
注意针对这一定理有效性的决定因素是 A1...An 事件不能同时发生。例如,在一次掷骰子中,得到 5 点或者 6 点的概率是:
[编辑] 定理 4
如果事件 A,B 是差集关系,则有,
[编辑] 定理 5 (任意事件加法法则)
对于事件空间 S 中的任意两个事件 A 和 B,有如下定理:
例如,在由一共 32 张牌构成的斯卡特扑克牌中随机抽出一张,其或者是"方片"或者是""的概率是多少?
事件 A,B 是或者的关系,且可同时发生,就是说抽出的这张牌即可以是"方片",又可以是"",A ∩ B ( 既发生 A 又发生 B ) 的值是 1 / 32,( 从示意图上也可以看出,即是方片又是只有一张,即概率是 1 / 32 ),因此有如下结果:
从图片上也可看出,符合这一条件的恰好是 11 张牌。注意到定理 3 是定理 5 的特殊情况,即 A,B 不同时发生,相应的 P(A∩B)=0。
[编辑] 定理 6 (乘法法则)
事件 A,B 同时发生的概率是:
注意应用如上公式的前提是事件 A,B 相互之间有一定联系,公式中的 P(A | B) 是指在 B 条件下 A 发生的概率,又称作条件概率。回到上面的斯卡特游戏中,在 32 张牌中随机抽出一张,即是方片又是的概率是多少呢?现用 P(A) 代表抽出方片的概率,用 P(B) 代表抽出的概率,很明显,A,B 之间有一定联系,即 A 里包含有 B,B 里又包含有 A,在 A 的条件下发生 B 的概率是 P(B | A)=1/8,则有:
或者,
从上面的图中也可以看出,符合条件的只有一张牌,即方片。
另一个例子,在 32 张斯卡特牌里连续抽两张 ( 第一次抽出的牌不放回去 ),连续得到两个的概率是多少呢?
设 A,B 分别为连续发生的这两次事件,我们看到,A,B 之间有一定联系,即 B 的概率由于 A 发生了变化,属于条件概率,按照公式有:
[编辑] 定理 7 (无关事件乘法法则)
两个不相关联的事件 A,B 同时发生的概率是:
注意到这个定理实际上是定理 6 (乘法法则) 的特殊情况,如果事件 A,B 没有联系,则有 P(A|B)=P(A),以及 P(B|A)=P(B)。现在观察一下轮盘游戏中两次连续的旋转过程,P(A) 代表第一次出现红色的概率,P(B) 代表第二次出现红色的概率,可以看出,A 与 B 没有关联,利用上面提到的公式,连续两次出现红色的概率为:
忽视这一定理是造成许多玩家失败的根源,普遍认为,经过连续出现若干次红色后,黑色出现的概率会越来越大,事实上两种颜色每次出现的概率是相等的,之前出现的红色与之后出现的黑色之间没有任何联系,因为球本身并没有"记忆",它并不"知道"以前都发生了什么。同理,连续 10 次出现红色的概率为 P=(18/37)10 =0.0007
[编辑] 完全概率
n 个事件 H1,H2,...Hn 互相间独立,且共同组成整个事件空间 S,即
, 以及
这时 A 的概率可以表示为,
证明:
按照公理 3 ,有
根据乘法法则,
因此有,
例如,一个随机试验工具由一个骰子和一个柜子中的三个抽屉组成,抽屉 1 里有 14 个白球和 6 个黑球,抽屉 2 里有 2 个白球和 8 个黑球,抽屉 3 里有 3 个白球和 7 个黑球,试验规则是首先掷骰子,如果获得小于 4 点,则抽屉 1 被选择,如果获得 4 点或者 5 点,则抽屉 2 被选择,其他情况选择抽屉 3 。然后在选择的抽屉里随机抽出一个球,最后抽出的这个球是白球的概率是:
P(白)=P(白|抽1)·P(抽1)+P(白|抽2)·P(抽2)+P(白|抽3)·P(抽3)
-
- =(14/20)·(3/6)+(2/10)·(2/6)+(3/10)·(1/6)
- =28/60=0.4667
从例子中可看出,完全概率特别适合于分析具有多层结构的随机试验的情况。
[编辑] 贝叶斯定理
贝叶斯定理由英国数学家贝叶斯 ( Thomas Bayes 1702-1761 ) 发展,用来描述两个条件概率之间的关系,比如 P(A|B) 和 P(B|A)。按照定理 6 的乘法法则,P(A∩B)=P(A)·P(B|A)=P(B)·P(A|B),可以立刻导出贝叶斯定理:
如上公式也可变形为
例如:一座别墅在过去的 20 年里一共发生过 2 次被盗,别墅的主人有一条狗,狗平均每周晚上叫 3 次,在盗贼入侵时狗叫的概率被估计为 0.9,问题是:在狗叫的时候发生入侵的概率是多少?
我们假设 A 事件为狗在晚上叫,B 为盗贼入侵,则 P(A) = 3 / 7,P(B)=2/(20·365)=2/7300,P(A | B) = 0.9,按照公式很容易得出结果:
另一个例子,现分别有 A,B 两个容器,在容器 A 里分别有 7 个红球和 3 个白球,在容器 B 里有 1 个红球和 9 个白球,现已知从这两个容器里任意抽出了一个球,且是红球,问这个红球是来自容器 A 的概率是多少?
假设已经抽出红球为事件 B,从容器 A 里抽出球为事件 A,则有:P(B) = 8 / 20,P(A) = 1 / 2,P(B | A) = 7 / 10,按照公式,则有:
[编辑] 概率分布
[编辑] 概率论的应用
虽然概率论最早产生于17世纪,然而其公理体系只在20世纪的20至30年代才建立起来并得到迅速发展,在过去的半个世纪里概率论在越来越多的新兴领域显示了它的应用性和实用性,例如:物理、化学、生物、医学、心理学、社会学、政治学、教育学,经济学以及几乎所有的工程学等领域。特别值得一提的是,概率论是今天数理统计的基础,其结果被用做问卷调查的分析资料或者对经济前景进行预测。
[编辑] 参考文献
- (德文) 彼得 缺菲尔 ( Peter Zoefel ):《 统计和经济学家 》PEASON Studium 出版社 2003 年 ISBN 3-8273-7062-0
- (德文) 约瑟夫 西拉 ( Josef Schira ):《 统计理论与企业管理 》PEASON Studium 出版社 2003 年 ISBN 3-8273-7041-8
- (德文) 汉斯-底特 黑伯曼 ( Hans-Dieter Hippmann ):《 统计学 》SCHAEFFER POESCHEL 出版社 2003 年 ISBN 3-7910-2119-2
- (德文) 里波舒尔茨 ( Seymour Lipschutz ):《 概率计算-理论和应用 》McGRAW-HILL BOOK COMPANY GmbH 出版社 1980 年 ISBN 0-07-084361-9
- (德文) 贝尔等 ( Beyer,Hackel,Pieper,Tiedge )《 概率计算和数学统计 》Harri Deutsch 出版社 1980 年 ISBN 3-87144-433-2
[编辑] 参见