地特三等申論題
109年
[統計] 統計學
第 一 題
📖 題組:
鄭主任使用線上適性化平台來訓練其部屬的軟體操作能力,該平台依學習者能力,適性調整每個人在線上接受訓練之時間,當能力達到精熟程度時,該訓練即停止。以下是10名部屬在訓練前之能力評估分數(0~200分,分數越高代表能力越強),以及達到精熟程度所需要之練習時間(分鐘)。 能力(y):181, 33, 13, 34, 47, 11, 20, 91, 74, 164 時間(x):50, 135, 165, 138, 122, 184, 155, 80, 88, 52 (每小題10分,共30分)
鄭主任使用線上適性化平台來訓練其部屬的軟體操作能力,該平台依學習者能力,適性調整每個人在線上接受訓練之時間,當能力達到精熟程度時,該訓練即停止。以下是10名部屬在訓練前之能力評估分數(0~200分,分數越高代表能力越強),以及達到精熟程度所需要之練習時間(分鐘)。 能力(y):181, 33, 13, 34, 47, 11, 20, 91, 74, 164 時間(x):50, 135, 165, 138, 122, 184, 155, 80, 88, 52 (每小題10分,共30分)
📝 此題為申論題,共 3 小題
小題 (一)
試求出「能力」(y)對「時間」(x)之線性迴歸方程式,並計算判定係數(coefficient of determination)。
思路引導 VIP
看到求線性迴歸方程式與判定係數,應先利用最小平方法(OLS)計算出各變數的離差平方和(SSxx, SSyy)與交叉乘積和(SSxy)。接著代入公式求出斜率與截距建立方程式,最後利用變異數分解比例(R² = (SSxy)² / (SSxx * SSyy))計算判定係數。
小題 (二)
試說明對「能力」作何種轉換(指數轉換:z = e^y,或自然對數轉換:z = log_e y),可以使轉換後之變數與「時間」之線性相關程度提高?先畫出原始資料中「能力」對「時間」之散布圖(scatter plot),並計算二者之相關係數,再與轉換後之散布圖與相關係數做比較。
思路引導 VIP
這題主要考驗對資料轉換與相關係數計算的熟悉度。首先應透過觀察原始數據判定變數間的非線性關係型態(指數遞減),再利用皮爾森相關係數公式分別計算轉換前後的相關程度,以具體的數據差異證明自然對數轉換能有效提升線性相關性。
小題 (三)
以轉換後之變數對「時間」作線性迴歸,得出迴歸方程式及判定係數,並說明該判定係數之意義。
思路引導 VIP
本題重點在於處理非線性資料的「線性化(Linearization)」並進行迴歸分析。觀察給定數據,能力(y)隨著時間(x)增加呈現非線性的指數遞減趨勢(學習曲線效應)。因此,解題第一步是對應變數 y 進行自然對數轉換 y' = ln(y),再運用最小平方法計算迴歸係數與判定係數 R²。最後解釋 R² 時,務必精確指出是解釋「轉換後變數」的變異,而非原變數的變異。