高中数学/概率与统计/随机性的描述与概率模型
阅读指南
编辑预备知识
编辑考试要求
编辑后续课程联系
编辑概率论应用极广。除了统计学以及从概率论自身发展出来的随机过程、贝叶斯推断、决策论等分支学科以外,模糊数学、密码学、机器学习、量子力学、金融数学、电子游戏策划等课题也都是完全离不开概率论的。
玩笑:概率论与赌博的关系也很密切,虽然还没有形成赌博学这个独立学科。虽然很多概率论普及文章会论述就赌必输、回头是岸的道理,但是谁知道数学家们研究概率论时心里面不是为了更好地赢一把呢?
玩笑:每一个看多了科幻片的沙发土豆即使没学过概率论,也一定都听说过“遇事不决,量子力学”的说法吧。很多没有才能的科幻片导演,编出了一些胡编乱造的技术名词,难以通过已知的物理法则解释,就说将其归结为新的量子原理敷衍观众。
基础知识
编辑知识引入
编辑生活中许多事情是否发生是难以预料的。习惯上,我们倾向于用一个0到1之间的数字描述一件事发生的可能性大小,数字越小代表越不可能发生,越大代表越有可能发生。这种简单的想法引申出了对可能性大小的定义。
讲到随机性,最俗套的例子就是抛2个面的硬币和抛6个面的骰子。经验告诉我们,较为均匀的硬币和骰子,胡乱扔出去并落地以后,以任何一面朝上的可能性都存在,而且看起来应该是均等可能地出现。硬幣的正面在英文中叫做大头(head),反面叫做尾巴(tail),所以擲硬幣游戏也叫做大头还是尾巴(heads or tails)。数学中经常会用H和T这2缩写字母代表单次擲硬幣的结果[1]。
玩笑:你们在考试遇到不知道答案应该选什么的选择题时,也是会需要一个硬币或骰子这种道具的(不要迷信“乱选一个C就好”的说法,这是对自己的不负责任,有的人连英语判断题都习惯性在答题卡上填C),或者恨不得突然拥有一个。如果你碰到了喜欢一边摇骰子,一边决定选项顺序的,那么正好棋逢对手。这在概率论中的确是有意义的问题。另外,不要把擲硬幣游戏和海飞丝(Head and Shoulders)洗发水混为一谈。从电影《进化危机》(Evolution)中我们可以得知海飞丝可以消灭许多外星怪兽,硬幣则没有这么多花哨的功能(除了还可以许愿)。
事件的分类和概率的概念
编辑在指定条件下[2]:
- 可能会发生,也可能不会发生的事件叫做随机事件(random event);
- 一定会发生的事件叫做必然事件(certain event);
- 一定不会发生的叫做不可能事件(impossible event)。
粗略地讲,如果能用一个(在[0, 1]之间的)数字明确地衡量一个事件发生的可能性大小,那么这样的数字就叫做该事件的概率(probability)或几率。[3]
必然事件发生的概率为1,不可能事件的发生概率为0。
提示:概率是事件本身的固有特性,数学上只考虑范围描述明确、可以用概率值描述的事件。
由以上规定可知任意事件A的概率P(A)一定满足: 。
注意:虽然必然事件发生的概率为1,不可能事件的发生概率为0,但是反过来未必如此。仔细推敲可以发现,我们没有规定概率为1的事件就是必然事件,也没有规定概率为0的事件就是不可能事件。在本节即将介绍的几何概率模型中就会见到这样的例子。
一般来说,对于一个复杂、一般性的问题,我们会将事件细分为更小、可能更明确的基本事件(elementary event)[4]。基本事件是概率论中无法严格定义的基本概念之一[5]。如果一个事件不可以继续被划分为颗粒度(或者说包含范围)更小的子事件,那么这样的事件就可以被当作基本事件。
事件像集合一样,也可以规定包含关系。如果事件A发生则B一定发生,就说事件B包含事件A(记作 ),或者事件A包含于事件B(记作 )。类似地,还可以定义2个事件A和B的并(即其中任一事件发生,记为 )与事件A和B的交(即其中所有事件都发生,记为 或AB),并可以用文氏图表示出来。[6][7][8]
知识背景:从集合观点谈论概率是很有启发性的。尤其是大学课本对概率的严格定义就是基于事件集合的。事件集合也被称为样本空间,单个事件被称为其中的样本点[5]。而一个具体的事件集合连同此集合上合理规定的事件运算、概率这三者一同被合称为概率空间[9][10]。当然只有事件集合明确的问题才有讨论事件概率的前提。在大学的概率论课程中将会看到,这种抽象使概率脱离了具体的问题背景,但是又保留了概率的运算本质,从而也减少了语境束缚,使得更一般性、更纯粹化的概率理论研究成为可能。
相关例题1: 已知A和B是任意的2个事件,利用集合的容斥原理求证关系式: 。[11]
相关例题2: 求证对于任意2个事件A、B成立的邦费罗尼(Bonferroni)不等式: 。[12]
频数和频率
编辑多次重复进行同一试验时,事件A发生的次数叫做频数(frequency),频数占总试验次数的比例叫做频率(relative frequency)[13][14]。
将事件的相关条件准备好,检测单次事件的发生情况叫做进行一次试验(trail)[2]。
提示:有的高中教科书默认频率当试验次数增大时会趋近于概率,并将这个趋近值直接定义为概率[15]。这种先入为主地对基于频率定义概率的做法并不符合目前占主流的频率学派(frequentist school)的观点。
提示:从文字本义来说,试验(trial)是尝试性的过程,和验证性的实验(experiment)是不同的概念。
显而易见,频率的数值稳定性是估算概率的前提[14]。它启发我们当频率的取值总是接近一个唯一的数值时,就将其取为概率[3]。使用频率代替概率是有条件的,只有当试验次数足够多时,频率才有可能接近概率,当然这个想法也需要严格证明[16]。如果是遇到不太稳定的频率,单凭一个近似化的想法也是无法很好地估计概率的。这个可以证明的结论被叫做大数定理。由于目前的知识铺垫还不充分,我们会等到在大数定律与蒙特卡罗方法一节中再作正式介绍。
提示:生产和生活中事件频率的稳定性是一种经验之谈[3]。如无特殊说明,不应该假定物理世界中所有事件的频率一定具有稳定性,也不能说频率不稳定的事件不能算作随机事件。出于许多方便性和实用性的考虑,数学上只是不去考虑不能用一个确定概率描述的随机性事件。
频率有时也用于在难于某些复杂事件难以直接求解出概率或其概率的表达式中存在未知量时,近似地计算出概率[14]。我们从本节开始就会逐渐讲到,有很多经典的蒙特卡罗方法就是从这个思路去想的。不过先提一句,利用频率估计概率利用了数形结合思想,做法简单直接,但也是效率很低的做法[17],是不得已时(比如用于计算概率的理论公式还没找到或者形式非常复杂)才会考虑的办法。
古典概率模型
编辑法国数学家皮埃尔-西蒙·拉普拉斯曾在1812年[18]给出了现在被称为古典概率模型的早期概率定义:
满足下列条件的概率问题称为古典概率模型(classical model of probability)或简称为古典概型[4][19][18]:
- 试验中所有可能出现的基本事件只有有限个;
- 每个基本事件出现的可能性相等。
在古典概率模型中,所有的可能情况为离散、有限多个的。反过来,所有情形离散、总数量有限的问题都可以视作古典概率模型问题处理。
关于古典概率模型的事件概率计算,有如下容易理解的规定:
如果一次试验中最多可能涉及n个基本事件,而且假设所有这n个基本事件的出现可能性都相等,那么其中每一个基本事件的发生概率都是 。此时如果某个事件A包含了m个基本事件,那么事件A的概率就是 。[2][19]
易知在古典概率模型中,有关系式 恒成立。[2]
从集合的观点看,如果把所有基本事件组成一个集合S,包含m个基本事件的事件A就对应于S的含有m个元素的子集A(为了方便把事件A对应的集合也记作A)[2]。如果这些基本事件都可以假设是等可能性的,那么事件A的概率就是这2集合元素数目的比值[2]:
常见的古典概型问题大体有3类:抽球问题、分房间问题、随机取数问题。[20]
几何概率模型
编辑人们在几何学研究中还发现另一种常见的等概率模型,但是因为涉及无穷个基本事件,所以无法直接被算作古典概率模型[18]。
如果每个事件发生的概率只与构成该事件区域的几何度量(例如长度、面积或体积)成比例,这样的概率模型称为几何概率模型(geometric model of probability)或简称为几何概型[21][17][19]。
在几何概率模型中,事件A的概率计算方法如下[21]:
- P(A) := 构成事件A的区域的度量值 试验涉及的全部结构所构成的总的度量值
在几何概率模型中,所有的可能情况为连续、无限多个的。反过来,所有情形连续、总数量无限的问题都可以视作几何概率模型问题处理。
- (1) 概率为0的事件不一定是不可能事件。
- (2) 概率为1的事件不一定是必然事件。
注意:叙述不清晰的几何概率问题很可能容易引发歧义。我们会在伯特兰悖论与公理化概率论简介一节中介绍伯特兰悖论这个著名的例子。
注意:实际上不是所有点集的长度、面积、体积的概念都是有意义的。在现代概率论中,我们使用测度的概念为长度、面积和体积下严格定义,并会试图证明有测度不存在的点集。这暗示不是所有的点集问题都是有意义的概率问题。[9]
补充习题
编辑- 举出一个既不是纯粹古典概率模型,也不是纯粹几何概率模型的概率问题。
参考资料
编辑- ↑ William Feller. 第1章“样本空间”第1.2节“例子”. (编) 王丽萍. 概率论及其应用. 图灵数学·统计学丛书 1. 胡迪鹤 (汉译者) 1 (原书第3版). 北京市崇文区夕照寺街14号: 人民邮电出版社. 2006: 10. ISBN 978-7-115-14729-5 (中文(中国大陆)).
- ↑ 2.0 2.1 2.2 2.3 2.4 2.5 人民教育出版社中学数学室. 第11章“概率”第11.1节“随机事件的概率”. 数学. 全日制普通高级中学教科书 (必修). 第2册 (下B) 1. 中国北京沙滩后街55号: 人民教育出版社. 2004: 124–126. ISBN 7-107-17987-X (中文(中国大陆)).
- ↑ 3.0 3.1 3.2 李贤平. 第1章“事件与概率”第1.1节“随机现象与统计规律性”中的“频率稳定性”部分和“频率与概率”部分. (编) 李蕊 (策划编辑); 杨帆 (责任编辑). 概率论基础. 普通高等教育“十一五”国家级规划教材. 王超 (责任校对) 3. 中国北京市崇西城区德外大街4号: 高等教育出版社. 2010: 3–7. ISBN 978-7-04-028890-2 (中文(中国大陆)).
- ↑ 4.0 4.1 张淑梅 (本册主编); 李建华; 宋莉莉(作者+责任编辑); 杨照宇; 左怀玲; 章建跃; 李勇. 第3章“概率”第3.2节“古典概型”第3.2.1小节“古典概型”. (编) 刘绍学 (主编); 钱珮玲 (副主编). 高中数学 (A版) 必修3 1. 中国北京市沙滩后街55号: 人民教育出版社. 2004: 118–123. ISBN 7-107-17707-9 (中文(中国大陆)).
- ↑ 5.0 5.1 William Feller. 第1章“样本空间”第1.1节“经验背景”. (编) 王丽萍. 概率论及其应用. 图灵数学·统计学丛书 1. 胡迪鹤 (汉译者) 1 (原书第3版). 中国北京市崇文区夕照寺街14号: 人民邮电出版社. 2006: 6–7. ISBN 978-7-115-14729-5 (中文(中国大陆)).
- ↑ 张淑梅 (本册主编); 李建华; 宋莉莉(作者+责任编辑); 杨照宇; 左怀玲; 章建跃; 李勇. 第3章“概率”第3.1节“随机事件的概率”第3.1.3小节“概率的基本性质”. (编) 刘绍学 (主编); 钱珮玲 (副主编). 高中数学 (A版) 必修3 1. 中国北京市沙滩后街55号: 人民教育出版社. 2004: 112–114. ISBN 7-107-17707-9 (中文(中国大陆)).
- ↑ 王梓坤. 第1章“事件与概率”第1.1节“概率论的现实背景”中“(二)事件的运算”部分. (编) 岳昌庆 (责任编辑); 李菡 (责任校对). 概率论基础及其应用. 新世纪高等学校教材·数学及应用数学专业主干课程系列教材. 赖德胜 (出版人) 3. 中国北京市新街口外大街19号: 北京师范大学出版社. 2007: 2–4. ISBN 978-7-303-03632-5 (中文(中国大陆)).
- ↑ 李贤平. 第1章“事件与概率”第1.2节“样本空间与事件”中“三、事件的运算”部分. (编) 李蕊 (策划编辑); 杨帆 (责任编辑). 概率论基础. 普通高等教育“十一五”国家级规划教材. 王超 (责任校对) 3. 中国北京市崇西城区德外大街4号: 高等教育出版社. 2010: 12–16. ISBN 978-7-04-028890-2 (中文(中国大陆)).
- ↑ 9.0 9.1 王梓坤. 第1章“事件与概率”第1.3节“概率空间”中“(一)概率的公理化定义”部分. (编) 岳昌庆 (责任编辑); 李菡 (责任校对). 概率论基础及其应用. 新世纪高等学校教材·数学及应用数学专业主干课程系列教材. 赖德胜 (出版人) 3. 中国北京市新街口外大街19号: 北京师范大学出版社. 2007: 19–21. ISBN 978-7-303-03632-5 (中文(中国大陆)).
- ↑ 李贤平. 第1章“事件与概率”第1.5节“概率空间”中“五、概率空间”部分. (编) 李蕊 (策划编辑); 杨帆 (责任编辑). 概率论基础. 普通高等教育“十一五”国家级规划教材. 王超 (责任校对) 3. 中国北京市崇西城区德外大街4号: 高等教育出版社. 2010: 53–55. ISBN 978-7-04-028890-2 (中文(中国大陆)).
- ↑ William Feller. 第1章“样本空间”第1.7节“基本定义和规则”. (编) 王丽萍. 概率论及其应用. 图灵数学·统计学丛书 1. 胡迪鹤 (汉译者) 1 (原书第3版). 中国北京市崇文区夕照寺街14号: 人民邮电出版社. 2006: 17–19. ISBN 978-7-115-14729-5 (中文(中国大陆)).
- ↑ 李贤平. 第1章“事件与概率”第1.5节“概率空间”中“三、概率”部分. (编) 李蕊 (策划编辑); 杨帆 (责任编辑). 概率论基础. 普通高等教育“十一五”国家级规划教材. 王超 (责任校对) 3. 中国北京市崇西城区德外大街4号: 高等教育出版社. 2010: 47–51. ISBN 978-7-04-028890-2 (中文(中国大陆)).
- ↑ 张淑梅 (本册主编); 李建华; 宋莉莉(作者+责任编辑); 杨照宇; 左怀玲; 章建跃; 李勇. 第3章“概率”第3.1节“随机事件的概率”第3.1.1小节“随机事件的概率”. (编) 刘绍学 (主编); 钱珮玲 (副主编). 高中数学 (A版) 必修3 1. 中国北京市沙滩后街55号: 人民教育出版社. 2004: 102. ISBN 7-107-17707-9 (中文(中国大陆)).
- ↑ 14.0 14.1 14.2 王梓坤. 第1章“事件与概率”第1.1节“概率论的现实背景”中“(四)频率”部分. (编) 岳昌庆 (责任编辑); 李菡 (责任校对). 概率论基础及其应用. 新世纪高等学校教材·数学及应用数学专业主干课程系列教材. 赖德胜 (出版人) 3. 中国北京市新街口外大街19号: 北京师范大学出版社. 2007: 8–9. ISBN 978-7-303-03632-5 (中文(中国大陆)).
- ↑ 张淑梅 (本册主编); 李建华; 宋莉莉(作者+责任编辑); 杨照宇; 左怀玲; 章建跃; 李勇. 第3章“概率”第3.1节“随机事件的概率”第3.1.3小节“概率的基本性质”. (编) 刘绍学 (主编); 钱珮玲 (副主编). 高中数学 (A版) 必修3 1. 中国北京市沙滩后街55号: 人民教育出版社. 2004: 104–105. ISBN 7-107-17707-9 (中文(中国大陆)).
- ↑ 王梓坤. 第3章“独立随机变数序列的极限定理”第3.3节“大数定理与强大数定理”中“(一)问题的一般提法”部分和“(二)大数定理”部分. (编) 岳昌庆 (责任编辑); 李菡 (责任校对). 概率论基础及其应用. 新世纪高等学校教材·数学及应用数学专业主干课程系列教材. 赖德胜 (出版人) 3. 中国北京市新街口外大街19号: 北京师范大学出版社. 2007: 187–190. ISBN 978-7-303-03632-5 (中文(中国大陆)).
- ↑ 17.0 17.1 李贤平. 第1章“事件与概率”第1.4节“几何概型”. (编) 李蕊 (策划编辑); 杨帆 (责任编辑). 概率论基础. 普通高等教育“十一五”国家级规划教材. 王超 (责任校对) 3. 中国北京市崇西城区德外大街4号: 高等教育出版社. 2010: 35–42. ISBN 978-7-04-028890-2 (中文(中国大陆)).
- ↑ 18.0 18.1 18.2 李贤平. 第1章“事件与概率”第1.3节“古典概型”中“一、模型与计算公式”部分. (编) 李蕊 (策划编辑); 杨帆 (责任编辑). 概率论基础. 普通高等教育“十一五”国家级规划教材. 王超 (责任校对) 3. 中国北京市崇西城区德外大街4号: 高等教育出版社. 2010: 17–20. ISBN 978-7-04-028890-2 (中文(中国大陆)).
- ↑ 19.0 19.1 19.2 王梓坤. 第1章“事件与概率”第1.1节“概率论的现实背景”中“(三)概率”部分. (编) 岳昌庆 (责任编辑); 李菡 (责任校对). 概率论基础及其应用. 新世纪高等学校教材·数学及应用数学专业主干课程系列教材. 赖德胜 (出版人) 3. 中国北京市新街口外大街19号: 北京师范大学出版社. 2007: 4–8. ISBN 978-7-303-03632-5 (中文(中国大陆)).
- ↑ 王梓坤. 第1章“事件与概率”第1.2节“古典型概率”中“(三)古典型随机试验中的概率计算”部分. (编) 岳昌庆 (责任编辑); 李菡 (责任校对). 概率论基础及其应用. 新世纪高等学校教材·数学及应用数学专业主干课程系列教材. 赖德胜 (出版人) 3. 中国北京市新街口外大街19号: 北京师范大学出版社. 2007: 12–13. ISBN 978-7-303-03632-5 (中文(中国大陆)).
- ↑ 21.0 21.1 张淑梅 (本册主编); 李建华; 宋莉莉(作者+责任编辑); 杨照宇; 左怀玲; 章建跃; 李勇. 第3章“概率”第3.3节“几何概型”. (编) 刘绍学 (主编); 钱珮玲 (副主编). 高中数学 (A版) 必修3 1. 中国北京市沙滩后街55号: 人民教育出版社. 2004: 129–134. ISBN 7-107-17707-9 (中文(中国大陆)).