普考申論題
109年
[圖書資訊管理] 資訊系統與資訊檢索概要
第 二 題
二、Word2Vec為一種Word Embedding的技術,請說明Word2Vec的技術內涵為何?相較於TF×IDF所決定的詞向量,採用Word2Vec所決定詞向量於向量空間模型(Vector Space Model)所設計的資訊檢索系統,其優缺點分別為何?(25分)
📝 此題為申論題
思路引導 VIP
本題考查自然語言處理(NLP)在資檢的應用。首先需解釋 Word2Vec 的核心觀念——「分布假說(Distributional Hypothesis)」。技術內涵要提到兩種模型(CBOW 與 Skip-gram)。接著對比傳統 TF-IDF(稀疏矩陣、局部計數)與 Word2Vec(稠密向量、語意空間)。思考重點在於:為什麼 Word2Vec 能抓到「同義詞」而 TF-IDF 不行?建議作答時間:22分鐘。
🤖
AI 詳解
AI 專屬家教
【考點分析】
- 字詞嵌入(Word Embedding)技術原理。
- Word2Vec 的兩大架構:CBOW 與 Skip-gram。
▼ 還有更多解析內容