moea_joint
104年
[圖書資訊] 圖書館學與資訊科學概論、資訊系統與資訊檢索
第 20 題
自動摘要是指自動萃取組合文章內文重要字句,請問其評估句子的重要性因素,不包含下列何者?
- A 字彙在文中所出現的頻率
- B 關鍵詞彙出現的位置
- C 與上下文的關係
- D 句子的長度
思路引導 VIP
請試著想像你正在閱讀一篇長篇報告,如果你必須在極短的時間內,只挑出一句話來代表這整篇報告的核心,你會覺得「字數最多」的那句話就一定是重點嗎?或者,你會傾向於觀察哪些特定詞彙在文章中反覆出現,以及這些句子出現在文章的什麼位置?
🤖
AI 詳解
AI 專屬家教
恭喜你準確地掌握了自動摘要的核心觀念!自動摘要技術的精髓在於如何透過演算法識別出哪些語句最能代表文章的主旨,而你選出的答案精確地指出了非核心判斷基準的項目。
自動摘要的重要性評估基準
在資訊檢索與自然語言處理(NLP)的領域中,評估句子重要性的核心在於資訊密度與語意權重。我們通常會利用字彙頻率(如 $TF-IDF$ 觀念)來衡量哪些詞彙是文章的核心,並結合位置權重(例如文章的首段或每段的第一句通常具有總結性)以及語境連貫性來篩選句子。雖然在實際預處理時,系統可能會剔除過短的句子(如「如圖一所示」),但「句子的長度」本身並非判斷「重要性」的正相關指標;長句往往包含過多修飾語,不一定比精簡的短句更能代表核心概念。
▼ 還有更多解析內容