初中數學/統計與機率

理論與用途介紹 编辑

基本架構 编辑

  1. 蒐集數據
  2. 演算
  3. 預測

有一點像算命

用途 编辑

  • 賭博與賭博設計
  • 保險,風險管理
  • 投資理財:但無法改變「高風險、高獲利」的法則
    1. 定存:獲利率 < 2% ,只夠抵消通貨膨脹。
    2. 大型年金:獲利率須達 4% ~ 5%,且採複利投資才能平衡。
    3. 股票:長期平均獲利率可以到 7%~10% ,但你不知道那一家公司能屹立不倒。
  • 幾乎每一件事(大數據)
    1. 百貨公司
      有一天,百貨公司寄了一份嬰兒用品型錄給你未婚的女兒。你認為這是對你女兒的侮辱,所以怒氣沖沖地打電話到百貨公司客服部抱怨,請他們以後不要再做這種事了。你抱怨完,卻看到女兒興味盎然地翻著型錄,原來她已經懷孕了。
      百貨公司比爸爸更早知道女兒懷孕的消息,不是黑色幽默,而是塔吉特(Target)百貨真實發生的事件。塔吉特怎麼知道顧客懷孕了?說穿了並不神奇,因為該公司設有準媽媽禮物登記處,讓準媽媽們登記自己想要的嬰兒禮物。由於這份清單等於確知已懷孕的顧客名單,塔吉特便依據名單上的消費紀錄,建立起懷孕婦女的購物模式(孕期會購買的商品清單),再用此模型比對其他客人的消費紀錄,找出消費形態類似的顧客,向她們行銷相關商品,達成「未卜先知」的結果。運用這個方法,塔吉特多找出了30%的行銷對象。
    2. 傳染病散布途徑:
      Google 在 2008 年推出流感趨勢預測,藉由統計關鍵字的搜尋次數,就能預測全球各地的流感疫情發展,不僅資訊更即時,準確率甚至超過政府的預警系統,Google 以此首開大數據(Big data,又稱巨量資料)應用到醫療領域的創舉,不僅讓其他幾家搜尋引擎紛紛跟進,如中國互聯網巨頭百度(Baidu),近日宣布與中國疾病預防控制中心合作,利用大數據預測流感疫情。
      加拿大拜歐迪(Bio Diaspora)公司,是全世界第一家運用大數據(Big Data)技術,結合地理資訊系統(Geographic Information System,GIS),分析歸納出病毒擴散的途徑,繪出一張張「病毒地圖」,進而預測出下一個可能爆發大規模感染區域的公司。 來自傳染病界、氣候學界、生物工程學界等不同領域的專家齊聚在此,嚴密監控著50多種致命病毒的動向。它是世界衛生組織(WHO)、美國疾管局、歐盟疾管局等全球各地來的求救對象。
    3. 社會風氣:若將 Google 搜尋引擎與 Twitter 結合,還能精準看出一些社會風氣的變化。兩位美國經濟學家結合兩者資訊,發現當《16歲懷孕》和《小媽咪》兩部美國影集播放時,青少年懷孕生子數比例大幅降低。
    4. 解除治理走向「暴政」的兩大根本限制:透過機器人、物聯網、大數據使政府可以得到無限量供應的忠誠武裝人員,並且能猜到人民想幹什麼。

名詞 编辑

  • 樣本:蒐集起來觀察,準備用來演算、推論、預測的數據
  • 平均數:所有樣本加起來/樣本個數
  • 眾數:樣本中出現最多的數
  • 中數或中位數:把所有觀察值按高低排序,位在正中間的數
    1. 找本班身高的平均數、眾數、中位數
    2. 找本班BMI的平均數、眾數、中位數
  • 大數法則:
    1. 偶然中包含著必然。
    2. 樣本數量越多,則其平均就越趨近期望值。
    3. 對物理量的測量實踐中,測定值的算術平均也具有穩定性。
       
      以擲單個骰子的過程來展示大數定律。隨著投擲次數的增加,所有結果的均值趨於3.5(骰子點數的期望值)。在投擲數量較小的時候(左邊)會表現得比較不準,當數量變得很大(右邊)的時候,它們將會很準。
      本班的丟骰子實驗
  • 期望值:按理應該出現的值,如
    1. 單顆骰子點數的期望值是1*⅙+2*⅙+3*⅙+4*⅙+5*⅙+6*⅙=3.5
      注意:3.5不屬於 1~6 六種可能結果中的任一個,所以期望值不是期望出現的結果。
    2. 彩券獎金的期望值
  • 全距:最大數-最小數
  • 標準差:
    1. 算出平均值
    2. 所有(樣本值-平均值)2加起來
    3. 除以樣本個數
    4. 開平方
  • 常態分布:<img src='http://jendo.org/files/doc/nd1.php' align=middle />

用棋盤方格法計算機率 编辑

誤用 编辑

  • 誤把獨立事件當成不獨立事件思考

以台灣歷次基測題目來理解觀念 编辑

  1. 算出以下這組數據的平均數、中位數、眾數、全距:
    70,70,70,70,80,80,80,80,80,90,90,90,90
    平均數:80
    眾數:80
    中位數:80
    全距:20
  2. 安安班上有九位同學,他們的體重資料如下(單位:公斤):
    57,54,47,42,49,48,45,47,50。請求出:
    平均數:48.78
    眾數:47
    中位數:48
    全距:15
  3. 一袋子中有4個圓球,顏色分別為紅、綠、藍、黑。每一個球被取到的機會相等,若自袋中任取兩次球(一次一球,取後放回),則取出的兩球一黑一紅的機率為何?
    答:⅛
  4. 父親的血型基因為 IA 、 IB ,母親的血型基因為 IA 、 i ,生出子女各種血型基的機率為何?
    A型:½
    B型:¼
    AB型:¼
    O型:0
  5. 父親的性染色體為 X 、 Y ,母親的性染色體為 X 、 X ,請問生出男生與女生的機率各為多少?
    男生:½
    女生:½
  6. 請算出一粒骰子投擲兩次,點數的期望值。
    答:7
  7. 某袋中有1號球8顆、2號球7顆、3號球6顆。若自袋中抽取一球,且每球被抽中的機會相等,則抽中3號球的機率為何?
    答:2/7
  8. 小華班上比賽投籃,每人投6球,下圖是班上所有學生投進球數的派圖。各球所佔的圓心角:0球:45°;1球:55°;2球:110°;3球:60°;4球:50°;5球:40°,合計360°。根據下圖,請回答:
     
    平均數:2.375
    眾數:2
    中位數:2
    全距:5
    進球的期望值為:2.375