高考申論題
107年
[圖書資訊管理(選試英文)] 資訊系統與資訊檢索
第 二 題
一般而言,「情書」、「心意」這兩個詞在主題(topic)上是比較相近的詞彙,而「宇宙」、「太空」這兩個詞也是主題或概念(concept)上較接近的詞彙。相對而言,「宇宙」、「心意」這兩詞在概念上,就比較不相關或不相似。試述一種可自動化的方法,來量化前述詞彙的相關度或是相似度,並舉例說明。(25 分)
📝 此題為申論題
思路引導 VIP
看到評估「詞彙相似度」的題目,應直覺聯想到自然語言處理(NLP)中的「分散式語意(Distributional Semantics)」概念與「向量空間模型(Vector Space Model)」。作答時,強烈建議以最具代表性的詞嵌入技術(如 Word2Vec)搭配「餘弦相似度(Cosine Similarity)」來破題,具體說明詞彙如何被自動量化為高維度向量,並透過數學公式計算出相似度分數,最後輔以題目給定的詞彙進行模擬數值舉例。
🤖
AI 詳解
AI 專屬家教
【破題】 在資訊檢索與自然語言處理領域,要自動化量化詞彙間的語意相關度或相似度,目前最主流且有效的方法是結合「詞嵌入模型(Word Embeddings)」與「餘弦相似度(Cosine Similarity)」。此方法基於「上下文相似的詞,其語意也相似」的分散式語意假說,將詞彙轉換為數學向量以進行量化計算。 【論述】
▼ 還有更多解析內容