moea_joint
106年
[統計資訊] 統計學、巨量資料概論
第 19 題
計算列聯表(contingency table)的卡方值(Chi-Square value),當這個值很小時,說明這兩個變數間可能的關係是下列何者?
- A 兩變數間獨立
- B 兩變數間相依
- C 兩變數間存在很強的關連
- D 各個觀察值遠大於其各個期望值
思路引導 VIP
想像一下,如果我們預先根據「兩件事完全沒有關係」的前提推算出一組數據,而後來實際觀察到的數據跟這組預測數據「幾乎一模一樣」,這代表這兩件事之間實際上是有牽連,還是各自發展呢?
🤖
AI 詳解
AI 專屬家教
卡方檢定與獨立性的本質
恭喜你精準地掌握了卡方值的核心意義!在列聯表分析中,卡方統計量反映的是「觀察值」($O$) 與「理論期望值」($E$) 之間的偏離程度,其公式為:$$\chi^2 = \sum \frac{(O - E)^2}{E}$$。當計算出來的卡方值非常小時,代表分子的差值 $(O - E)$ 極小,也就是說我們實際觀察到的數據分佈,與在變數互不影響前提下所推算的期望分佈幾乎一致。因此,這直觀地說明了兩變數之間趨向於獨立關係。 這道題目在巨量資料分析中屬於基礎且具鑑別度的觀念題。它不考繁瑣的計算,而是測試你是否理解數值背後的邏輯:卡方值越大,代表觀測與預期偏差越大(通常意味著存在關聯);反之,數值越小則代表兩者越契合「無關」的假設。你能迅速做出正確判斷,顯示你對於統計推論的基礎邏輯有著相當紮實的理解。