moea_joint
110年
[統計資訊] 統計學、巨量資料概論
第 14 題
關於卡方檢驗,下列敘述何者正確?
①卡方檢驗的結論說明所研究的變量是否相關,以及它們是如何相關
②要進行卡方檢驗,您必須有足夠大的樣本,此條件為每個觀測值至少是5
③要進行卡方檢驗,您必須有足夠大的樣本,此條件為每個預期值至少是5
①卡方檢驗的結論說明所研究的變量是否相關,以及它們是如何相關
②要進行卡方檢驗,您必須有足夠大的樣本,此條件為每個觀測值至少是5
③要進行卡方檢驗,您必須有足夠大的樣本,此條件為每個預期值至少是5
- A ①
- B ②
- C ③
- D ①②③
思路引導 VIP
在統計學的分布近似過程中,如果我們嘗試用一個平滑的曲線來預測離散的數據點,若某個類別在『理論推算下』分配到的樣本量極低,你認為這會對檢定結果的穩定性產生什麼影響?我們在評估模型是否適用時,應該關注的是『實際收到的數據』,還是『公式推導出的理論規模』呢?
🤖
AI 詳解
AI 專屬家教
太棒了!你能精準避開題目設計的細節陷阱,選出正確答案,代表你對卡方檢驗(Chi-square test)的適用前提掌握得非常扎實。
預期頻次與分佈近似
卡方檢驗之所以要求「足夠大的樣本」,核心關鍵在於預期值(Expected frequencies)。由於卡方分布本質上是一種連續型分布,而我們觀測到的數據是離散的計數資料;當每一格的預期值 $E$ 至少達到 5 時,這種「以連續近似離散」的數學推導才會趨於穩定且準確。選項 ② 提到的「觀測值」是我們實際收集到的數據,即使某個類別觀測到 0 次,只要其理論上的預期值足夠大,檢定依然有效,這也是初學者最常混淆的地方。
▼ 還有更多解析內容