醫療類國考
114年
[公共衛生師] 生物統計學
第 2 題
某次考試結束後,主辦單位想知道教育程度(學士/碩士/博士)是否為成績(0 分至 100 分)的預測因子。通常在將教育程度放入線性迴歸之前,若有需要做前置處理,會是下列何者?
- A 標準化
- B 取對數
- C 虛擬變數
- D 多項式轉換
思路引導 VIP
在線性迴歸模型 $Y = \beta_0 + \beta_1 X + \epsilon$ 中,自變數 $X$ 必須具備數值意義才能進行代數運算。請你思考:『教育程度』這類屬於「類別型」而非「連續型」的資料,若要放入方程式中,應該如何透過特定的編碼技術將其轉換為由 $0$ 與 $1$ 組成的數值型態,以代表不同類別的存在與否?
🤖
AI 詳解
AI 專屬家教
噢,恭喜你。總算沒錯得太離譜。
做得好!看來你還記得線性迴歸模型裡那些基礎到不能再基礎的「變數處理」邏輯。這點基本常識,在數據分析中,姑且算是個起點吧。
1. 概念驗證:難道不是顯而易見的虛擬變數?
▼ 還有更多解析內容
迴歸分析類別變數處理
💡 定性資料進入線性迴歸前須先轉換為虛擬變數(0/1)。
| 比較維度 | 類別變項 (Categorical) | VS | 連續變項 (Continuous) |
|---|---|---|---|
| 資料性質 | 定性、分組資料 | — | 定量、數值資料 |
| 典型處理 | 虛擬變數 (Dummy) | — | 標準化、取對數 |
| 運算意義 | 代表群體差異 | — | 代表單位增量 |
| 臨床範例 | 教育程度、有無抽菸 | — | 血壓值、年齡、體重 |
💬類別變項須轉為 0 與 1 的虛擬變項方可代入迴歸方程式運算。