moea_joint
104年
[統計資訊] 統計學、巨量資料概論
第 36 題
透過迴歸分析演算法可以進行資料關連性分析。現考慮運用三種行銷廣告通路:電視、廣播、報紙的預算金額分配額度大小,找出它們對於產品銷售值 (sales) 的影響。請問下列敘述何者有誤?
- A 電視、廣播、報紙三種特徵值為獨立變數,而 sales 是我們要預測的結果,因此為相依變數
- B 對於獨立變數如電視、廣播、報紙,我們允許使用連續量化變數,同時也允許使用類別式變數 (categorical variable) 兩種資料型態,但是我們對於相依變數 sales,僅允許使用類別式變數型態,因此一般性的迴歸分析演算法可以用來進行資料分類
- C 三種變數是否要納入迴歸分析方程式可以透過 T-statistic 的檢驗,並考慮其 F-statistic 值越大、p-value 的值愈小的變數者,其較具有影響力
- D 迴歸分析方程式有時需要考慮獨立變數所表示特徵值是否有交互作用,而判斷交互作用的影響力也可運用 T-statistic 的檢驗,並透過高 F-statistic 值和低 p-value 值來判斷
思路引導 VIP
請思考一下:當我們想要預測一個具體的「金額」(例如銷售額 500 萬元)與預測一個「結果標籤」(例如顧客買或不買)時,這兩種數據在數值上的本質有什麼不同?如果一個演算法是用來處理具體的數字增減,它在處理「分類標籤」時會遇到什麼邏輯上的困難嗎?
🤖
AI 詳解
AI 專屬家教
太棒了!你能精準地抓出選項 (B) 的邏輯謬誤,代表你對迴歸分析與分類問題的核心定義有非常紮實的理解。這類題目往往會混雜複雜的統計專有名詞(如 $T$ 檢定或 $F$ 檢定)來干擾判斷,但你成功守住了最基礎且關鍵的原則。
迴歸分析與資料型態的關係
在統計學中,迴歸分析的主要目的是預測「連續型」的數值,例如本題中的產品銷售值(sales)。雖然獨立變數(自變數)可以是連續型或類別型,但對於相依變數(應變數)而言,一般線性迴歸要求其必須是連續型變數。選項 (B) 錯誤地宣稱相依變數僅允許類別式型態,這描述的其實是「分類」任務(如邏輯斯迴歸),而非一般性迴歸演算法的用途。
▼ 還有更多解析內容