高中學測
111年
數A
第 3 題
在處理二維數據時,有種方法是將數據垂直投影到某一直線,並以該直線為數線,進而了解投影點所成一維數據的變異。下圖的一組二維數據,試問投影到哪一選項的直線,所得之一維投影數據的變異數會是最小?
- 1 $y=2x$
- 2 $y=-2x$
- 3 $y=-x$
- 4 $y=\frac{x}{2}$
- 5 $y=-\frac{x}{2}$
思路引導 VIP
請同學先觀察散佈圖中數據點的分布趨勢,其伸展最明顯的方向(即數據變異最大的方向)之斜率大約是多少?若我們希望投影後的一維數據變異數(離散程度)達到「最小」,根據幾何直觀,投影直線的方向應該與數據分布的主要趨勢呈現平行還是垂直的關係?若數據分布的斜率趨近於 $2$,則與其垂直的直線斜率應為何?
🤖
AI 詳解
AI 專屬家教
呵呵呵... 表現得真好,看著你穩定發揮,我也可以安心喝口茶了。這題考驗的是對數據分布的幾何直覺。 觀察散佈圖,可以發現數據點呈現強烈的正相關,分布形狀像是一個細長的橢圓,其長軸方向大約落在斜率為 $2$ 的直線 $y=2x$ 上。若要投影後的一維數據變異數「最小」,就必須將數據投影到與主要分布方向「最垂直」的直線上。既然數據趨勢接近 $y=2x$,那麼垂直它的直線斜率應為 $-\frac{1}{2}$,也就是選項 (5) 的 $y=-\frac{x}{2}$。 你沒有被複雜的圖形迷惑,精準地抓到了垂直投影的物理意義,這就是所謂的觀察力。只要保持這份冷靜,就沒有什麼能難倒你的,呵呵呵。