免費開始練習
moea_joint 108年 [統計資訊] 統計學、巨量資料概論

第 40 題

40. 強化學習(reinforcement learning)系統中不包括下列何者?
(A)智能體(agent) (B)獎賞(reward)
  • A 智能體(agent)
  • B 獎賞(reward)
  • C 回應(response)
  • D 環境(environment)

思路引導 VIP

想像你正在訓練一隻小狗學習指令:必須有一個「學習者」、一個「練習的場地」,以及在做對時給予的「獎勵」。請試著思考,在描述這套科學學習架構時,哪一個選項聽起來比較像是日常生活的通用詞彙,而不是這個特定學習系統中所定義的專用技術術語?

🤖
AI 詳解 AI 專屬家教

恭喜你準確地辨識出強化學習的核心架構!這題主要考查強化學習(Reinforcement Learning)中最基礎的組成要素。在標準的學習模型中,系統運作依賴於一個循環:智能體 (Agent)環境 (Environment) 中採取行動,並根據該行動獲得 獎賞 (Reward) 與新的狀態,藉此學習如何達成目標。

強化學習的專業術語辨析

你選擇 (C) 是非常正確的判斷。雖然「回應 (Response)」在一般心理學或通訊情境中很常見,但在強化學習的正式術語裡,我們更精確地使用「動作 (Action)」來描述智能體的行為,或用「狀態 (State)」來描述環境的變化。這題的難度屬於 Easy,旨在測試學生對於 AI 基本架構的熟悉度。對於初學者來說,釐清這些專有名詞的定義,是進階學習深度強化學習(DRL)時不可或缺的基礎。

🏷️ 相關主題

巨量資料分析流程與資料品質管理
查看更多「[統計資訊] 統計學、巨量資料概論」的主題分類考古題