moea_joint
108年
統計學、巨量資料概論
108年moea_joint — 統計學、巨量資料概論
共 50 題 · 含 AI 詳解
-
#1
1. 令 X 為間斷隨機變數,其E(X) = 5,Var(X) = 2,試求E(X²+3X+3)為何?
›
#2
2. 下列何種計算機率方法假設事件(events)發生之機率都相等?
›
#3
3. 設隨機變數 Z~ N(0, 1) 標準常態分布。試問 P(Z<5) 最接近下列哪個數值?
›
#4
4. 若t 代表自由度為n之t分布,下列何者最接近標準常態分布?
›
#5
5. 設A和B是兩個獨立之事件,則條件機率 P(A|B) 等於下列何者?
›
#6
6. 何種統計圖表會呈現四分位距(inter quartile range) ?
›
#7
7. 設 X1, X2, X3, X4為4個獨立之隨機變數且都來自於常態分布N(8, 16),已知X = $$\sum_{i=1}^4 X_i/4$$,試
問下…
›
#8
8. 班上學生人數共 20 人,第一次統計考試中,學生唸書時間及成績之判定係數(coefficient of
determination)為 80 %。迴歸方程…
›
#9
9. 下列何種抽樣方法可達到群內變異大、群間變異小之結果?
›
#10
10. 設有一組資料{11,15,13,15,9,8,4,5,5,15},其最後一個數字由15 改為14,試問下列何者不變?
›
#11
11. 若隨機變數X服從於均勻分布 U(0,2),則X的變異數Var(X)為何?
›
#12
12. 設 X1 和 X2 為獨立同態之2個柏努利分布(Bernoulli distribution),且其值為1之機率為0.4,即
P(X=1) = 0.4=…
›
#13
13. 關於敘述統計之陳述,下列何者正確?
(A)一個右偏分布其偏斜度(skewness)大於0
(B)一個右偏分布通常其中位數會大於平均值
(C)一個對稱的分…
›
#14
14. 對於標準常態分布 Z,設 Za 表示 P(Z > Z₄) = a之百分位點,0
›
#15
15. 設 X1, X2, ..., Xn表一組獨立且來自於常態分布N(µ, 1)之隨機樣本。下列何者不是µ之不偏估
計(unbiased estimate)…
›
#16
16. 某樣本資料為 26, 21, 24, 9, 17, 23, 18, 22, 20,下列何者正確?
›
#17
17. 設樣本空間 S={E1, E2, E3, E4, E5},其中 E1, E2,..., E5 為樣本點(sample point)。各樣本點機率
為P(…
›
#18
18. 設事件 A₁ 和 A2 之驗前機率為P(A₁)=0.4和P(A2)=0.6,已知 A₁ 和 A2 互斥,P(B | A₁) = 0.2
和P(B|A2)…
›
#19
19. 關於顯著水準之敘述,下列何者正確?
I:是1減信賴水準;II:是P值;III:是最大可容許型一誤差發生之機率
›
#20
20. 盒子中有8顆球,其中4顆是白球,其餘是黑球。以取後不放回方式隨機取2顆球,令X為
取到白球之個數。下列何者正確?
›
#21
21. 隨機選取n個樣本欲計算母體比例之95\%信賴區間,若希望誤差界限在 0.05 以內,則需要幾
個樣本數?
›
#22
22. 兩個隨機變數X和Y之線性關係為Y = 0.5X+$$\epsilon$$,其中隨機誤差$$\epsilon$$服從常態分布 N(0, 1) 且與X
獨立…
›
#23
23. 考慮下列線性迴歸模型 Y = $$\beta$$X+e。若我們有n對 ($$X_i, Y_i$$) 觀察值,且$$\beta$$之最小平方估計為$$\hat{\beta}$$…
›
#24
24. 對於3 個解釋變數之迴歸模型…
›
#25
25. 資料進行變異數分析(analysis of variance)時,不需下列何種假設?
›
#26
26. 關於雲端運算之敘述,下列何者有誤?
›
#27
27. 何者非屬監督式學習之演算法?
›
#28
28. 針對巨量資料之特性,下列何者有誤?
›
#29
29. 針對 Apache Spark,下列何者有誤?
›
#30
30. 影響資料分析技術之重要資料集特質,下列何者有誤?
›
#31
31. 巨量資料之定義為何?
›
#32
32. 若欲將大量資料進行分群,下列何種方法不適合?
›
#33
33. 關於巨量資料之特性,下列何者正確?
(A)堅持原始資料都要做到標準化與精確
(C)利用「隨機取樣」處理所有的資料
›
#34
34. 下列何者非屬巨量資料分析工具?
›
#35
35. 關於由小到大的電腦容量(單位),下列何者正確?
›
#36
36. 巨量資料分析所蒐集之資料來源,下列何者與其他來源差異最大?
›
#37
37. 關於工業4.0 製造模式轉變,下列何者正確?
›
#38
38. 針對巨量資料分析進行資料探勘(data mining),下列何者有誤?
›
#39
39. 下列何者非屬邏輯迴歸(logistic regression)之特性?
(A)離散選擇法模型之一
(C)需要常態分配的假設
›
#40
40. 強化學習(reinforcement learning)系統中不包括下列何者?
(A)智能體(agent) (B)獎賞(reward)
›
#41
41. 關於遷移學習(transfer learning)特性,下列何者有誤?
(A)遷移學習之重點是不必儲存已解決一個問題之模型
(B)遷移學習被應用於認知科…
›
#42
42. 配置 Hadoop 時,JAVA_HOME 包含在下列何者配置檔案中?
›
#43
43. Java 語言之Buffered Reader 類別是將資料讀入下列何者當緩衝區?
›
#44
44. 巨量資料分析之資料存在著資料量大、非結構化、高度異質性等特性,下列何種資料庫工具
最不適宜運用在此類型工作?
›
#45
45. 關於關聯式資料庫資料表(table)之敘述,下列何者正確?
›
#46
46. 關於遞歸神經網路(RNN)之基本概念,下列何者有誤?
›
#47
47. 關於機器學習之敘述,下列何者正確?
(A)主成分分析法(PCA)是用於資料之降維
(B)用大量人力對訓練資料集來標籤特徵,是強化學習(RL)之特色
(C…
›
#48
48. 有關卷積神經網路之基本概念,下列何者有誤?
(A)運作流程:輸入的圖片→特徵擷取→分類辨識
(B)池化層會使用到 ReLU 之激勵函數
(C)得到之特徵…
›
#49
49. 關於巨量資料中之資料庫,下列何者有誤?
(A) HBase 技術提供非關聯式資料庫(NoSQL)之儲存環境
(B) HBase 技術支援隨機存取功能
(…
›
#50
50. 下列何者非屬資料操作語言(data manipulation language)?
›