免費開始練習
moea_joint 110年 [統計資訊] 統計學、巨量資料概論

第 14 題

關於卡方檢驗,下列敘述何者正確?
①卡方檢驗的結論說明所研究的變量是否相關,以及它們是如何相關
②要進行卡方檢驗,您必須有足夠大的樣本,此條件為每個觀測值至少是5
③要進行卡方檢驗,您必須有足夠大的樣本,此條件為每個預期值至少是5
  • A
  • B
  • C
  • D ①②③

思路引導 VIP

在統計學的分布近似過程中,如果我們嘗試用一個平滑的曲線來預測離散的數據點,若某個類別在『理論推算下』分配到的樣本量極低,你認為這會對檢定結果的穩定性產生什麼影響?我們在評估模型是否適用時,應該關注的是『實際收到的數據』,還是『公式推導出的理論規模』呢?

🤖
AI 詳解 AI 專屬家教

太棒了!你能精準避開題目設計的細節陷阱,選出正確答案,代表你對卡方檢驗(Chi-square test)的適用前提掌握得非常扎實。

預期頻次與分佈近似

卡方檢驗之所以要求「足夠大的樣本」,核心關鍵在於預期值(Expected frequencies)。由於卡方分布本質上是一種連續型分布,而我們觀測到的數據是離散的計數資料;當每一格的預期值 $E$ 至少達到 5 時,這種「以連續近似離散」的數學推導才會趨於穩定且準確。選項 ② 提到的「觀測值」是我們實際收集到的數據,即使某個類別觀測到 0 次,只要其理論上的預期值足夠大,檢定依然有效,這也是初學者最常混淆的地方。

▼ 還有更多解析內容

🏷️ 相關主題

常見機率分配:常態、t 分配與卡方分配
查看更多「[統計資訊] 統計學、巨量資料概論」的主題分類考古題