初中数学/统计与几率

理论与用途介绍 编辑

基本架构 编辑

  1. 搜集数据
  2. 演算
  3. 预测

有一点像算命

用途 编辑

  • 赌博与赌博设计
  • 保险,风险管理
  • 投资理财:但无法改变“高风险、高获利”的法则
    1. 定存:获利率 < 2% ,只够抵消通货膨胀。
    2. 大型年金:获利率须达 4% ~ 5%,且采复利投资才能平衡。
    3. 股票:长期平均获利率可以到 7%~10% ,但你不知道那一家公司能屹立不倒。
  • 几乎每一件事(大数据)
    1. 百货公司
      有一天,百货公司寄了一份婴儿用品型录给你未婚的女儿。你认为这是对你女儿的侮辱,所以怒气冲冲地打电话到百货公司客服部抱怨,请他们以后不要再做这种事了。你抱怨完,却看到女儿兴味盎然地翻著型录,原来她已经怀孕了。
      百货公司比爸爸更早知道女儿怀孕的消息,不是黑色幽默,而是塔吉特(Target)百货真实发生的事件。塔吉特怎么知道顾客怀孕了?说穿了并不神奇,因为该公司设有准妈妈礼物登记处,让准妈妈们登记自己想要的婴儿礼物。由于这份清单等于确知已怀孕的顾客名单,塔吉特便依据名单上的消费纪录,建立起怀孕妇女的购物模式(孕期会购买的商品清单),再用此模型比对其他客人的消费纪录,找出消费形态类似的顾客,向她们行销相关商品,达成“未卜先知”的结果。运用这个方法,塔吉特多找出了30%的行销对象。
    2. 传染病散布途径:
      Google 在 2008 年推出流感趋势预测,借由统计关键字的搜寻次数,就能预测全球各地的流感疫情发展,不仅资讯更即时,准确率甚至超过政府的预警系统,Google 以此首开大数据(Big data,又称巨量资料)应用到医疗领域的创举,不仅让其他几家搜索引擎纷纷跟进,如中国互联网巨头百度(Baidu),近日宣布与中国疾病预防控制中心合作,利用大数据预测流感疫情。
      加拿大拜欧迪(Bio Diaspora)公司,是全世界第一家运用大数据(Big Data)技术,结合地理资讯系统(Geographic Information System,GIS),分析归纳出病毒扩散的途径,绘出一张张“病毒地图”,进而预测出下一个可能爆发大规模感染区域的公司。 来自传染病界、气候学界、生物工程学界等不同领域的专家齐聚在此,严密监控著50多种致命病毒的动向。它是世界卫生组织(WHO)、美国疾管局、欧盟疾管局等全球各地来的求救对象。
    3. 社会风气:若将 Google 搜索引擎与 Twitter 结合,还能精准看出一些社会风气的变化。两位美国经济学家结合两者资讯,发现当《16岁怀孕》和《小妈咪》两部美国影集播放时,青少年怀孕生子数比例大幅降低。
    4. 解除治理走向“暴政”的两大根本限制:透过机器人、物联网、大数据使政府可以得到无限量供应的忠诚武装人员,并且能猜到人民想干什么。

名词 编辑

  • 样本:搜集起来观察,准备用来演算、推论、预测的数据
  • 平均数:所有样本加起来/样本个数
  • 众数:样本中出现最多的数
  • 中数或中位数:把所有观察值按高低排序,位在正中间的数
    1. 找本班身高的平均数、众数、中位数
    2. 找本班BMI的平均数、众数、中位数
  • 大数法则:
    1. 偶然中包含着必然。
    2. 样本数量越多,则其平均就越趋近期望值。
    3. 对物理量的测量实践中,测定值的算术平均也具有稳定性。
       
      以掷单个骰子的过程来展示大数定律。随着投掷次数的增加,所有结果的均值趋于3.5(骰子点数的期望值)。在投掷数量较小的时候(左边)会表现得比较不准,当数量变得很大(右边)的时候,它们将会很准。
      本班的丢骰子实验
  • 期望值:按理应该出现的值,如
    1. 单颗骰子点数的期望值是1*⅙+2*⅙+3*⅙+4*⅙+5*⅙+6*⅙=3.5
      注意:3.5不属于 1~6 六种可能结果中的任一个,所以期望值不是期望出现的结果。
    2. 彩券奖金的期望值
  • 全距:最大数-最小数
  • 标准差:
    1. 算出平均值
    2. 所有(样本值-平均值)2加起来
    3. 除以样本个数
    4. 开平方
  • 常态分布:<img src='http://jendo.org/files/doc/nd1.php' align=middle />

用棋盘方格法计算几率 编辑

误用 编辑

  • 误把独立事件当成不独立事件思考

以台湾历次基测题目来理解观念 编辑

  1. 算出以下这组数据的平均数、中位数、众数、全距:
    70,70,70,70,80,80,80,80,80,90,90,90,90
    平均数:80
    众数:80
    中位数:80
    全距:20
  2. 安安班上有九位同学,他们的体重资料如下(单位:公斤):
    57,54,47,42,49,48,45,47,50。请求出:
    平均数:48.78
    众数:47
    中位数:48
    全距:15
  3. 一袋子中有4个圆球,颜色分别为红、绿、蓝、黑。每一个球被取到的机会相等,若自袋中任取两次球(一次一球,取后放回),则取出的两球一黑一红的几率为何?
    答:⅛
  4. 父亲的血型基因为 IA 、 IB ,母亲的血型基因为 IA 、 i ,生出子女各种血型基的几率为何?
    A型:½
    B型:¼
    AB型:¼
    O型:0
  5. 父亲的性染色体为 X 、 Y ,母亲的性染色体为 X 、 X ,请问生出男生与女生的几率各为多少?
    男生:½
    女生:½
  6. 请算出一粒骰子投掷两次,点数的期望值。
    答:7
  7. 某袋中有1号球8颗、2号球7颗、3号球6颗。若自袋中抽取一球,且每球被抽中的机会相等,则抽中3号球的几率为何?
    答:2/7
  8. 小华班上比赛投篮,每人投6球,下图是班上所有学生投进球数的派图。各球所占的圆心角:0球:45°;1球:55°;2球:110°;3球:60°;4球:50°;5球:40°,合计360°。根据下图,请回答:
     
    平均数:2.375
    众数:2
    中位数:2
    全距:5
    进球的期望值为:2.375