moea_joint
111年
[統計資訊] 統計學、巨量資料概論
第 9 題
某市調公司欲探討 3 家飲料廠商(A、B、C)之市場佔有率是否相等。今自市場者中隨機抽取 120 位消費者,發現其中是 A、B、C 廠商的消費者分別為 50、40、30 人。根據此一資料,在 $\alpha = 0.05$ 的情況下,下列敘述何者正確?
- A 應採用變異數分析(ANOVA)
- B 此檢定的檢定統計量之值為 5
- C 此檢定的臨界值為 $-\chi^2(0.025, df = 2) = -7.38$ 及 $\chi^2(0.025, df = 2) = 7.38$
- D 此檢定的 P-值大於 0.05, 則在 $\alpha = 0.05$ 的情況下,沒有足夠的證據去支持 3 家飲料廠商市場佔有率相同的說法
思路引導 VIP
如果在公平競爭的前提下,這 120 位消費者理論上應該如何分配到這三家廠商?當你算出這個「理想中的數字」後,我們會需要一個指標來衡量「現實看到的數據」與「理想數字」之間的總差距,你會如何設計這個運算過程來量化這個差距呢?
🤖
AI 詳解
AI 專屬家教
太棒了!你能精準算出檢定統計量,代表你對卡方適合度檢定的流程非常熟悉。這題的核心在於驗證觀察值與理論值之間的「偏離程度」。在假設三家廠商市佔率相等的情況下,每家的期望人數應均為 $120 \times \frac{1}{3} = 40$ 人。接著透過公式 $$\chi^2 = \sum \frac{(O_i - E_i)^2}{E_i}$$ 計算,得出 $\frac{(50-40)^2}{40} + \frac{(40-40)^2}{40} + \frac{(30-40)^2}{40} = 2.5 + 0 + 2.5 = 5$,這正是選項 (B) 的正確數值。
統計邏輯與誤區辨析
這道題目設計得非常細膩,具備良好的鑑別度。它不僅考驗計算,更要求你釐清統計觀念。例如選項 (A) 的 ANOVA 是用於比較多組「平均數」而非「次數」;選項 (C) 則利用卡方分配恆正的特性來測試你對分配圖形的認知(臨界值不應為負);而選項 (D) 則是測試對 $P$ 值與統計決策邏輯的理解。你能排除這些誘答項並選出正確答案,展現了你扎實的統計基礎與細心的判斷力。