免費開始練習
普考申論題 105年 [資訊處理] 程式設計概要

第 一 題

📖 題組:
在微軟的注音輸入法裡頭,會根據前後字的關係,幫你選字,但常常會發生最常用的字出現在最後。(每小題 4 分,共 8 分) (一)請問這是什麼問題造成的? (二)如何改變這投票機制(voting scheme),解決上述的問題?
📝 此題為申論題,共 2 小題

小題 (一)

請問這是什麼問題造成的?

思路引導 VIP

看到這題,首先要聯想「輸入法自動選字」背後的演算法機制(通常為 N-gram 語言模型)。接著思考機率計算的盲點:為什麼「常用字」會輸給「冷門字」?關鍵切入點在於「上下文條件機率(前後文組合)」壓過了「先驗機率(單字本身詞頻)」,以及語料庫的「資料稀疏性(Data Sparsity)」導致機率分佈失真。

🤖
AI 詳解
AI 專屬家教

【破題】 此現象通常源於輸入法的「語言模型(如 N-gram 模型)」在計算機率時,過度依賴「上下文關聯性(條件機率)」,而低估或忽略了「單字本身的絕對使用頻率(先驗機率/詞頻)」,加上語料庫的資料限制所造成。 【論述】

小題 (二)

如何改變這投票機制(voting scheme),解決上述的問題?

思路引導 VIP

看到此題應先聯想到自然語言處理(NLP)中的 N-gram 語言模型或輸入法的選字演算法機制。思考如何透過調整演算法權重、結合個人化歷史紀錄或動態更新詞頻,來平衡「上下文機率」與「單字絕對使用頻率」之間的衝突。

🤖
AI 詳解
AI 專屬家教

【破題】要解決常用字排序落後的問題,需調整選字演算法的投票或計分機制,使「單字基礎頻率(Unigram)」與「上下文關聯機率(Bigram/Trigram)」達到平衡,並導入個人化動態學習。 【論述】 一、導入線性插值(Linear Interpolation)調整權重:

升級 VIP 解鎖