高考申論題
111年
[資訊處理] 資料庫應用
第 一 題
📖 題組:
機器學習(Machine Learning)主要任務可區分為監督式學習(Supervised Learning)與非監督式學習(Unsupervised Learning),監督式學習包括分類(Classification)與迴歸(Regression),非監督式學習最常用的是分群(Clustering)。(每小題 10 分,共 20 分)
機器學習(Machine Learning)主要任務可區分為監督式學習(Supervised Learning)與非監督式學習(Unsupervised Learning),監督式學習包括分類(Classification)與迴歸(Regression),非監督式學習最常用的是分群(Clustering)。(每小題 10 分,共 20 分)
📝 此題為申論題,共 4 小題
小題 (一)
分類與迴歸要預測的值最主要的差異為何?
思路引導 VIP
這題考查對監督式學習中「目標變數(Target Variable)」類型的理解。分類與迴歸最大的區別在於預測結果是「質(類別)」還是「量(數值)」。思考時可以舉簡單的例子,如「是否為垃圾郵件」與「房價預測」。
小題 (二)
分類與分群所分析的資料最主要的差異為何?
思路引導 VIP
這題考查「監督式」與「非監督式」學習在資料準備上的差異。核心概念是「標籤(Label)」。分類需要已知正確答案的資料來訓練模型,而分群則是讓機器從未標註的資料中找規律。
小題 (三)
若資料表改為下列 2 個表格 R1(A1,A4,A5)、R2(A2,A3,A4,A5)(12 分)
(a)請你先判定新表格 R1、R2 的候選鍵。
(b)這樣的切割,是否滿足 Lossless Join?
(c)這樣的切割,是否會喪失任何功能相依?
(d)這樣設計最高是滿足第幾正規化,為什麼?
思路引導 VIP
解決關聯綱目切割題,首先要將原表的功能相依(FD)投影到新表格中,推導各自的候選鍵。接著利用「交集是否能決定其中一個表格(即交集為某表之超鍵)」來判斷無失真結合,並檢查原 FD 是否完整保留在至少一個新表中,最後依據表格內部的 FD 判定正規化層級。
小題 (四)
若你不同意上述(三)設計,你建議應如何修改原設計師所提出資料表 R(A1,A2,A3,A4,A5)?你必須同樣地依上述(a)、(b)、(c)、(d)四方面來說明你建議的設計。(12 分)
思路引導 VIP
本題測驗關聯式資料庫的正規化(Normalization)能力。首先需找出原資料表 R 的候選鍵為 {A1, A3, A4},接著利用給定的功能相依(FD1, FD2)進行無失真分解,將其提升至 BCNF。最後,對應原題意中評估資料庫設計的四個常見面向(資料重複性、新增、刪除、修改異常),逐一說明新設計如何解決異常問題。