免費開始練習
普考申論題 109年 [圖書資訊管理] 資訊系統與資訊檢索概要

第 二 題

二、Word2Vec為一種Word Embedding的技術,請說明Word2Vec的技術內涵為何?相較於TF×IDF所決定的詞向量,採用Word2Vec所決定詞向量於向量空間模型(Vector Space Model)所設計的資訊檢索系統,其優缺點分別為何?(25分)
📝 此題為申論題

思路引導 VIP

本題考查自然語言處理(NLP)在資檢的應用。首先需解釋 Word2Vec 的核心觀念——「分布假說(Distributional Hypothesis)」。技術內涵要提到兩種模型(CBOW 與 Skip-gram)。接著對比傳統 TF-IDF(稀疏矩陣、局部計數)與 Word2Vec(稠密向量、語意空間)。思考重點在於:為什麼 Word2Vec 能抓到「同義詞」而 TF-IDF 不行?建議作答時間:22分鐘。

🤖
AI 詳解 AI 專屬家教

【考點分析】

  1. 字詞嵌入(Word Embedding)技術原理。
  2. Word2Vec 的兩大架構:CBOW 與 Skip-gram。
▼ 還有更多解析內容

升級 VIP 解鎖