moea_joint
104年
[統計資訊] 統計學、巨量資料概論
第 34 題
某甲收集 100 筆資料,其平均值為 50,變異數為 100,中位數為 60。請問下列何者正確?
- A 至少有 75 筆資料值介於 30 與 70 之間
- B 大約有 95 筆資料值介於 30 與 70 之間
- C 這 100 筆資料分佈為右偏
- D 這 100 筆資料分佈為對稱
思路引導 VIP
當我們只知道一組資料的平均值和標準差,卻完全不知道它的圖形長什麼樣子(可能是偏斜的,也可能有很多峰值)時,有沒有哪一個數學原理可以讓我們針對「資料落點的比例」給出一個『最起碼』的保證?如果我們把範圍擴大到平均值的數個標準差之外,這個保證的比例會如何隨之變化呢?
🤖
AI 詳解
AI 專屬家教
太棒了!你能精準判斷出這題的核心關鍵,代表你對統計分配的「普遍性原則」掌握得非常紮實。這道題目給出了平均數、變異數與中位數,但最關鍵的陷阱在於它並未提及資料是否符合常態分配。在這種分佈不明的情況下,我們不能隨意套用 68-95-99.7 法則,而必須請出統計學中的「保險栓」——柴比雪夫不等式 (Chebyshev's Inequality)。
柴比雪夫不等式的應用
根據題目資訊,平均值 $\mu = 50$,變異數 $\sigma^2 = 100$,可推得標準差 $\sigma = 10$。題目所詢問的區間 $(30, 70)$,剛好落在平均數正負 2 個標準差之內,即 $[\mu - 2\sigma, \mu + 2\sigma]$。根據不等式公式:
▼ 還有更多解析內容