moea_joint 108年 [統計資訊] 統計學、巨量資料概論

第 40 題

強化學習(reinforcement learning)系統中不包括下列何者?
(A)智能體(agent)
(B)獎賞(reward)

A 智能體(agent)
B 獎賞(reward)
C 回應(response)
D 環境(environment)

思路引導 VIP

想像你正在訓練一隻小狗學習指令：必須有一個「學習者」、一個「練習的場地」，以及在做對時給予的「獎勵」。請試著思考，在描述這套科學學習架構時，哪一個選項聽起來比較像是日常生活的通用詞彙，而不是這個特定學習系統中所定義的專用技術術語？

🤖

AI 詳解 AI 專屬家教

恭喜你準確地辨識出強化學習的核心架構！這題主要考查強化學習（Reinforcement Learning）中最基礎的組成要素。在標準的學習模型中，系統運作依賴於一個循環：智能體 (Agent) 在 環境 (Environment) 中採取行動，並根據該行動獲得 獎賞 (Reward) 與新的狀態，藉此學習如何達成目標。

強化學習的專業術語辨析

你選擇 (C) 是非常正確的判斷。雖然「回應 (Response)」在一般心理學或通訊情境中很常見，但在強化學習的正式術語裡，我們更精確地使用「動作 (Action)」來描述智能體的行為，或用「狀態 (State)」來描述環境的變化。這題的難度屬於 Easy，旨在測試學生對於 AI 基本架構的熟悉度。對於初學者來說，釐清這些專有名詞的定義，是進階學習深度強化學習（DRL）時不可或缺的基礎。

🏷️ 相關主題

巨量資料處理流程與知識發現程序

查看更多「[統計資訊] 統計學、巨量資料概論」的主題分類考古題

📝 同份考卷的其他題目

查看 108年[統計資訊] 統計學、巨量資料概論全題

第 40 題

思路引導 VIP

強化學習的專業術語辨析

📎 觀念相似題

🏷️ 相關主題

📝 同份考卷的其他題目