moea_joint
104年
統計學、巨量資料概論
104年moea_joint — 統計學、巨量資料概論
共 50 題 · 含 AI 詳解
-
#1
抽樣分配是指下列何者的分配?
›
#2
某一公司有 4 個零件供應商 ($S_1, S_2, S_3, S_4$),其零件在 $S_1, S_2, S_3, S_4$ 之供應比例分別是 30\%、20…
›
#3
某甲欲研析全臺灣地區加油站之服務量,而執行一抽樣調查以推估總服務量,為顧及各地區之特性,宜使用下列何種抽樣設計?
›
#4
在簡單線性迴歸模型,斜率的估計值代表下列何種意涵?
›
#5
下列何者正確?
›
#6
若每一個可能的樣本被抽到的機會相等,此抽樣方法為下列何者?
›
#7
若 A 與 B 事件互相獨立,$P(A) = 0.38$ 且 $P(B) = 0.55$,則 $P(B|A)$ 為下列何者?
›
#8
某甲欲研析新設加油站之顧客平均等待時間,作為安排服務人員人數之依據,請問下列哪一種分配最適合用來描述兩位顧客到達該加油站的時間間隔?
›
#9
$X, Y$ 為二服從標準常態分配之隨機變數且兩者獨立,則下列何者有誤?
›
#10
樣本統計量的期望值等於所欲估計的母數時,則此樣本統計量具有下列何種特性?
›
#11
統計學家證實,要提高抽樣的準確度,最好的方式為下列何者?
›
#12
下列何者不是用於資料的相關性分析 (Correlation Analysis)?
›
#13
分析資料、建構模型來預測顧客的貸款申請是「安全的」或「有風險的」,是下列何者?
›
#14
下列何者為巨量資料最適當的定義?
›
#15
巨量資料會使分析資訊的方式產生三大改變,不包括下列何者?
›
#16
關於巨量資料分析的概念,下列何者正確?
›
#17
關於分類的訓練資料集與測試資料集的敘述,下列何者有誤?
›
#18
請問機器學習 (Machine Learning) 上所使用的深化學習 (Deep Learning) 和下列哪一個演算法有直接相關連?
›
#19
巨量資料分析是一連串分階段流程的處理步驟 (Pipeline),針對此巨量資料分析的流程,下列何者正確?
›
#20
一般巨量資料處理的單位為 PB 級;1 PB 的資料為 1 GB 資料的幾倍大?
›
#21
下列哪一項資訊技術和巨量資料最不相關?
›
#22
對於決策樹 (Decision Tree) 機器學習演算法,下列何者有誤?
›
#23
關於 Hadoop 的敘述,下列何者有誤?
›
#24
如果使用者在 MapReduce 中打算使用外部執行檔來定義其工作,需要利用下列何者?
›
#25
下列何者是知識發現 (Knowledge Discovery) 的正確程序?
›
#26
下表為臺北市及新北市居民對於是否應適度調漲電價來促進節約能源意識之比例。假定臺北市及新北市居民之贊成比例分別為 $P_1$ 及 $P_2$,則檢定 $H_0: P_1 = P_2$…
›
#27
保險公司請求某家諮詢公司,幫忙確認非常高機率的假保險理賠事件。已知某工業的假理賠要求比例為 3\%。該諮詢公司決定從該工業隨機抽樣 100 家公司確認其是否申請…
›
#28
某間航空公司預計從甲、乙、丙、丁這 4 種訂票系統中擇一,並希望該訂票系統讓乘客遇到較少障礙。因此該航空公司設計一實驗設計來收集資料,其中每個訂票系統隨機選擇…
›
#29
對兩個獨立母群體以 T 檢定檢定其母體均數是否相等,下列何者正確?
›
#30
若 $Z$ 是一個標準常態隨機變數,則 $P(-1.5 < Z < 0)$ 將會比 $P(1.5 < Z < 3.0)$
›
#31
一個完全隨機設計,下列何者正確?
›
#32
下表是一個不完整的變異數分析表 (ANOVA table),請問檢定統計量 F 值為何?
›
#33
欲建立母體均數的區間估計值,假設使用 36 個觀察值時,其母體均數的區間估計值為 $19.76 \pm 1.32$,則當樣本大小 $n$ 以 144 取代 36…
›
#34
某甲收集 100 筆資料,其平均值為 50,變異數為 100,中位數為 60。請問下列何者正確?
›
#35
卡方分配 (chi-square distribution) 可應用在下列哪項?
›
#36
透過迴歸分析演算法可以進行資料關連性分析。現考慮運用三種行銷廣告通路:電視、廣播、報紙的預算金額分配額度大小,找出它們對於產品銷售值 (sales) 的影響。請…
›
#37
透過統計學習方法論,我們希望找出一個決策樹資料分類器以避免資料分類時的過度解讀 (overfitting),請問對於資料過度解讀的現象,下列何者有誤?
›
#38
對於巨量資料分析 Spark 平台,下列何者有誤?
›
#39
一般推薦系統 (Recommender System) 時常會採用下列哪一個方法作為核心技術,來估計產品與使用者間的可能關係?
›
#40
下列何種統計學習的演算法是用來進行資料的分群 (Clustering),但不能用來進行資料分類 (Classification)?
›
#41
巨量資料中的資料類別出現的頻率,時常會形成所謂的長尾現象,一般可利用以下哪種統計工具來描述此種形式的資料分佈?
›
#42
以分析使用者打卡 (check in) 的應用為例,如果打卡的位置為變數 X。使用者 A 習慣在一個位置打卡 (如公司),其打卡位置的分佈統計模型為 $P_A(X)$…
›
#43
在視覺化工具中為了在二維畫面中檢視資料點之間的關係 (相似度或距離),例如社群網路、地圖中重要都市等,一般都使用下列哪種形式的演算法?
›
#44
關於 Bayes Nets 與 Naïve Bayes 兩種統計學習演算法,下列何者有誤?
›
#45
Hadoop 一般對於疊代式 (Iterative) 程序執行起來較沒效率,主要原因為下列何者?
›
#46
對於巨量資料分析所需要的統計 (或機器) 學習技術,下列何者有誤?
›
#47
巨量資料分析的 R 程式語言具有多種不同資料結構型態 (data types) 的表達格式,下列何者有誤?
›
#48
關於巨量資料分析系統 Hadoop 平台,下列何者有誤?
›
#49
關於巨量資料分析系統 Hadoop 平台,下列何者正確?
›
#50
在 Spark 大數據分析平台上執行下列的 Python 程式碼:
file=spark.textFile(“hdfs://…”) //opens a file…
›