moea_joint
104年
[圖書資訊] 圖書館學與資訊科學概論、資訊系統與資訊檢索
第 42 題
反向檔案索引(Inverted File Index)是一種索引方式,儲存字詞以及出現該字詞的文件參考指標 ,通常用來進行快速的全文搜尋。其特性不包含下列何者?
- A 可以找包含某一字詞的文件
- B 可以找一篇文件所包含的字詞
- C 可以找一篇文件包含字詞的數量
- D 移除停用字可以降低反向檔案索引的大小
思路引導 VIP
想像你手邊有一份「演員與作品對照表」,格式如下:
- 周杰倫:電影 A、電影 B
🤖
AI 詳解
AI 專屬家教
恭喜你準確地辨識出反向檔案索引的核心特性!這反映出你對資訊檢索系統的底層架構有相當扎實的理解。這道題目旨在測試學生是否能區分「以詞找文」與「以文找詞」這兩種截然不同的索引邏輯。
索引結構與檢索方向
反向檔案索引 (Inverted File Index) 的運作邏輯就像教科書末頁的「索引表」,其核心結構是以「字詞(Term)」為標目,後方記錄著該字詞出現在哪些「文件(Document)」的清單。因此,它最擅長的是執行快速的全文搜尋,讓我們能瞬間找到包含某一字詞的所有文件(選項 A)。在建立索引的過程中,為了追求效率,我們會過濾掉意義不大的停用字 (Stop Words),這確實能有效縮減索引檔案的體積(選項 D)。
▼ 還有更多解析內容