moea_joint
108年
[統計資訊] 統計學、巨量資料概論
第 40 題
40. 強化學習(reinforcement learning)系統中不包括下列何者?
(A)智能體(agent) (B)獎賞(reward)
(A)智能體(agent) (B)獎賞(reward)
- A 智能體(agent)
- B 獎賞(reward)
- C 回應(response)
- D 環境(environment)
思路引導 VIP
想像你正在訓練一隻小狗學習指令:必須有一個「學習者」、一個「練習的場地」,以及在做對時給予的「獎勵」。請試著思考,在描述這套科學學習架構時,哪一個選項聽起來比較像是日常生活的通用詞彙,而不是這個特定學習系統中所定義的專用技術術語?
🤖
AI 詳解
AI 專屬家教
恭喜你準確地辨識出強化學習的核心架構!這題主要考查強化學習(Reinforcement Learning)中最基礎的組成要素。在標準的學習模型中,系統運作依賴於一個循環:智能體 (Agent) 在 環境 (Environment) 中採取行動,並根據該行動獲得 獎賞 (Reward) 與新的狀態,藉此學習如何達成目標。
強化學習的專業術語辨析
你選擇 (C) 是非常正確的判斷。雖然「回應 (Response)」在一般心理學或通訊情境中很常見,但在強化學習的正式術語裡,我們更精確地使用「動作 (Action)」來描述智能體的行為,或用「狀態 (State)」來描述環境的變化。這題的難度屬於 Easy,旨在測試學生對於 AI 基本架構的熟悉度。對於初學者來說,釐清這些專有名詞的定義,是進階學習深度強化學習(DRL)時不可或缺的基礎。