免費開始練習
地特四等申論題 107年 [統計] 資料處理概要

第 一 題

📖 題組:
二、有一資料表如下圖,共有八筆資料,第一欄是鍵值(key value)的二進位表示法(Binary representation),第二欄是姓氏資料。今要用雜湊(hash)的方式來將資料分成若干籃子(bucket),請回答下列有關雜湊的問題。 (一)假設雜湊函數(hashing function)是 key mod 4,亦即將 key 的值除以 4 之餘數值,即為雜湊函數值。假設每個籃子的容量最多可存三筆資料,請以上表之資料為例,將鍵值之二進位值轉換為十進位值,並將這些資料按所給的雜湊函數,區分為應有的籃子,並以此例說明什麼是靜態雜湊(static hashing)。(10 分) (二)假設每個籃子的容量最多可存二筆資料,請以上表鍵值之二進位表示法為例,用動態雜湊(dynamic hashing)的方法,將這八筆資料做 hash。(10 分)
題組圖片
📝 此題為申論題,共 2 小題

小題 (一)

假設雜湊函數(hashing function)是 key mod 4,亦即將 key 的值除以 4 之餘數值,即為雜湊函數值。假設每個籃子的容量最多可存三筆資料,請以上表之資料為例,將鍵值之二進位值轉換為十進位值,並將這些資料按所給的雜湊函數,區分為應有的籃子,並以此例說明什麼是靜態雜湊(static hashing)。(10 分)

思路引導 VIP

解題分三步:首先將二進位鍵值精確轉換為十進位;接著依據雜湊函數(key mod 4)算出對應的籃子編號,並注意每個籃子最多 3 筆容量的限制來放置資料;最後利用此例固定 4 個籃子且籃子 0 剛好存滿的現象,點出靜態雜湊「空間大小固定不變」的特性與溢位風險。

🤖
AI 詳解
AI 專屬家教

【解題關鍵】進行進制轉換並代入雜湊函數 h(k) = k mod 4,再依據「配置空間固定」的特徵說明靜態雜湊的定義。 【解答】 一、鍵值轉換為十進位與雜湊值計算

小題 (二)

假設每個籃子的容量最多可存二筆資料,請以上表鍵值之二進位表示法為例,用動態雜湊(dynamic hashing)的方法,將這八筆資料做 hash。(10 分)

思路引導 VIP

本題考查動態雜湊(Dynamic Hashing),最典型的代表為「可擴充雜湊(Extendible Hashing)」。解題關鍵在於設定全域深度(Global Depth)與區域深度(Local Depth),並依序插入資料。遇到容量溢位(大於 2 筆)時,若區域深度等於全域深度,則需擴充目錄;若小於,則僅分裂籃子。需主動宣告採用「前綴位元(Prefix)」做為索引依據,展示嚴謹的演算法邏輯。

🤖
AI 詳解
AI 專屬家教

【解題關鍵】本題採用動態雜湊中最常見的「可擴充雜湊(Extendible Hashing)」方法。利用目錄(Directory)、全域深度(Global Depth, GD)及區域深度(Local Depth, LD)來管理籃子(Bucket)。假設以二進位鍵值之「左側前綴位元(Prefix)」作為目錄索引。 【解答】 初始狀態:GD = 0,僅 1 個 Bucket(LD = 0),容量上限 2 筆。

📝 同份考卷的其他題目

查看 107年[統計] 資料處理概要 全題

升級 VIP 解鎖