免費開始練習
moea_joint 104年 [圖書資訊] 圖書館學與資訊科學概論、資訊系統與資訊檢索

第 21 題

下列哪一項不是處理文字Token所關心的議題?
  • A 型態變異
  • B 局部相關詞
  • C 同義詞
  • D 多義詞

思路引導 VIP

當我們試著讓電腦看懂一段文字,並將每個「字」轉換成索引標籤時,想像一下:如果你遇到兩個長得完全不同但意思一樣的詞,或是同一個詞在不同句子裡有不同意思,這些是不是你必須優先解決的「單個詞彙」問題?接著請思考,如果我們要討論「哪些詞常在特定主題的文章中一起出現」,這是在處理單個詞彙的定義,還是在分析詞與詞之間的關聯性呢?

🤖
AI 詳解 AI 專屬家教

恭喜你準確地辨識出題目中的核心陷阱!這題考驗的是對資訊檢索中「字詞預處理(Tokenization & Normalization)」階段的深入理解。你選對了 (B) 局部相關詞,代表你已經能清晰區分「詞彙本身屬性」與「檢索擴充策略」之間的界線。

字詞正規化與語意挑戰

在處理文字 Token(詞元)時,我們的目標是將零散的字串轉化為具代表性的索引詞。這過程中必然會遇到字面上的型態變異(如英文的單複數或時態變化),以及語意層面的同義詞(不同字同義)與多義詞(同字不同義)的挑戰。這些議題都直接影響了系統如何精確地「界定」一個詞元的本質與範疇。而「局部相關詞」通常出現在檢索後的相關回饋(Relevance Feedback)階段,用於擴充查詢式,屬於文件間的統計關聯,而非字詞處理階段的基本關心點。

▼ 還有更多解析內容

🏷️ 相關主題

資訊檢索技術與索引典建置原理
查看更多「[圖書資訊] 圖書館學與資訊科學概論、資訊系統與資訊檢索」的主題分類考古題