地特四等申論題
111年
[經建行政] 統計學概要
第 一 題
📖 題組:
2007 年《紐約時報》報導,美國家庭年收入中位數為 55,500 美元。2013 年 14 個家庭收入(1,000 美元)的樣本數據按升序排列如下: 46.5, 48.7, 49.4, 51.2, 51.3, 51.6, 52.1, 52.1, 52.2, 52.4, 52.5, 52.9, 53.4, 64.5 (平均數 52.2,變異數 16) 根據以上數據回答下列問題:(每小題 15 分,共 30 分) (一)計算五個數字的摘要(five-number summary),包括最小值,第一四分位數(Q1),第二四分位數(Q2),第三四分位數(Q3),最大值。 (二)使用 z 分數方法,2013 年 14 個家庭收入的樣本數據是否包含異常值?若使用第一和第三四分位數的值以及四分位數範圍(即 (Q1-1.5(IQR),Q3+1.5(IQR)))來檢測異常值的方法,請比較其與使用 z 分數方法的結果之差異。
2007 年《紐約時報》報導,美國家庭年收入中位數為 55,500 美元。2013 年 14 個家庭收入(1,000 美元)的樣本數據按升序排列如下: 46.5, 48.7, 49.4, 51.2, 51.3, 51.6, 52.1, 52.1, 52.2, 52.4, 52.5, 52.9, 53.4, 64.5 (平均數 52.2,變異數 16) 根據以上數據回答下列問題:(每小題 15 分,共 30 分) (一)計算五個數字的摘要(five-number summary),包括最小值,第一四分位數(Q1),第二四分位數(Q2),第三四分位數(Q3),最大值。 (二)使用 z 分數方法,2013 年 14 個家庭收入的樣本數據是否包含異常值?若使用第一和第三四分位數的值以及四分位數範圍(即 (Q1-1.5(IQR),Q3+1.5(IQR)))來檢測異常值的方法,請比較其與使用 z 分數方法的結果之差異。
📝 此題為申論題,共 2 小題
小題 (一)
計算五個數字的摘要(five-number summary),包括最小值,第一四分位數(Q1),第二四分位數(Q2),第三四分位數(Q3),最大值。
思路引導 VIP
看到「五個數字的摘要(five-number summary)」,應直覺聯想到包含最小值、第一四分位數(Q1)、第二四分位數/中位數(Q2)、第三四分位數(Q3)以及最大值。解題時需確認樣本資料已依序排列,並帶入百分位數所在位置公式 $L_p = (n+1) \times p$ 或 $L_p = n \times p$ 求出四分位數,建議寫出完整的線性內插計算過程以確保得分。
小題 (二)
使用 z 分數方法,2013 年 14 個家庭收入的樣本數據是否包含異常值?若使用第一和第三四分位數的值以及四分位數範圍(即 (Q1-1.5(IQR),Q3+1.5(IQR)))來檢測異常值的方法,請比較其與使用 z 分數方法的結果之差異。
思路引導 VIP
本題主要測驗兩種離群值(異常值)檢定方法的計算與特性比較。考生應先分別利用 Z 分數公式與 IQR(四分位距)公式找出異常值,並進一步探討平均數與標準差易受極端值影響(缺乏穩健性),而四分位距法不受極端值影響的差異。