高考申論題
110年
[統計] 統計學
第 二 題
📖 題組:
三、以下是(X, Y)兩變數之觀測資料: X 11 9 14 10 12 15 7 5 13 8 6 Y 7.46 6.77 12.74 7.11 7.81 8.84 6.08 5.39 8.15 6.42 5.73 以下考慮皮爾森相關係數(Pearson’s correlation coefficient r)與皮爾曼等級相關係數(Spearman’s rank correlation coefficient rs)。 (一)試畫出(X, Y)之散布圖,並試計算 r 與 rs。(10 分) (二)試刪去本數據中之離群子後,重新計算 r 與 rs。(5 分) (三)試問 r 與 rs 何者容易受離群子影響?(5 分)
三、以下是(X, Y)兩變數之觀測資料: X 11 9 14 10 12 15 7 5 13 8 6 Y 7.46 6.77 12.74 7.11 7.81 8.84 6.08 5.39 8.15 6.42 5.73 以下考慮皮爾森相關係數(Pearson’s correlation coefficient r)與皮爾曼等級相關係數(Spearman’s rank correlation coefficient rs)。 (一)試畫出(X, Y)之散布圖,並試計算 r 與 rs。(10 分) (二)試刪去本數據中之離群子後,重新計算 r 與 rs。(5 分) (三)試問 r 與 rs 何者容易受離群子影響?(5 分)
📝 此題為申論題,共 3 小題
小題 (二)
試刪去本數據中之離群子後,重新計算 r 與 rs。(5 分)
思路引導 VIP
從散布圖和數據觀察,(14, 12.74) 的 Y 值顯著偏離線性趨勢(Anscombe's quartet 的變形)。刪除該點後,剩餘 10 筆資料重新計算。
小題 (一)
試畫出(X, Y)之散布圖,並試計算 r 與 rs。(10 分)
思路引導 VIP
- 散布圖:觀察 X 與 Y 的趨勢,識別是否有離群點((14, 12.74) 看起來明顯偏高)。
- 皮爾森 r:使用原始數值計算 $S_{xx}, S_{yy}, S_{xy}$。
小題 (三)
試問 r 與 rs 何者容易受離群子影響?(5 分)
思路引導 VIP
皮爾森相關係數基於原始數值(矩),而皮爾曼等級相關基於等級(秩)。極端值在計算等級時,其影響被限制在「最高等級」或「最低等級」,而不會因為其數值「無限大」而造成劇烈波動。