普考申論題 105年 [資訊處理] 程式設計概要

第一題

📖 題組：
在微軟的注音輸入法裡頭，會根據前後字的關係，幫你選字，但常常會發生最常用的字出現在最後。（每小題 4 分，共 8 分） (一)請問這是什麼問題造成的？ (二)如何改變這投票機制（voting scheme），解決上述的問題？

📝 此題為申論題，共 2 小題

小題 (一)

請問這是什麼問題造成的？

思路引導 VIP

看到這題，首先要聯想「輸入法自動選字」背後的演算法機制（通常為 N-gram 語言模型）。接著思考機率計算的盲點：為什麼「常用字」會輸給「冷門字」？關鍵切入點在於「上下文條件機率（前後文組合）」壓過了「先驗機率（單字本身詞頻）」，以及語料庫的「資料稀疏性（Data Sparsity）」導致機率分佈失真。

🤖

AI 詳解

AI 專屬家教

【破題】此現象通常源於輸入法的「語言模型（如 N-gram 模型）」在計算機率時，過度依賴「上下文關聯性（條件機率）」，而低估或忽略了「單字本身的絕對使用頻率（先驗機率/詞頻）」，加上語料庫的資料限制所造成。【論述】

小題 (二)

如何改變這投票機制（voting scheme），解決上述的問題？

思路引導 VIP

看到此題應先聯想到自然語言處理（NLP）中的 N-gram 語言模型或輸入法的選字演算法機制。思考如何透過調整演算法權重、結合個人化歷史紀錄或動態更新詞頻，來平衡「上下文機率」與「單字絕對使用頻率」之間的衝突。

🤖

AI 詳解

AI 專屬家教

【破題】要解決常用字排序落後的問題，需調整選字演算法的投票或計分機制，使「單字基礎頻率（Unigram）」與「上下文關聯機率（Bigram/Trigram）」達到平衡，並導入個人化動態學習。【論述】一、導入線性插值（Linear Interpolation）調整權重：

🏷️ 相關主題

物件導向程式設計概念與應用

查看更多「[資訊處理] 程式設計概要」的主題分類考古題

📝 同份考卷的其他題目

查看 105年[資訊處理] 程式設計概要全題

第 一 題

小題 (一)

思路引導 VIP

小題 (二)

思路引導 VIP

📎 觀念相似題

🏷️ 相關主題

📝 同份考卷的其他題目

第一題