moea_joint
107年
統計學、巨量資料概論
107年moea_joint — 統計學、巨量資料概論
共 50 題 · 含 AI 詳解
-
#1
一位正在競選的政治人物,對 30,000 名註冊選民進行一項民意抽調。接受抽調訪談的 200 位註冊選民中,48\% 的選民表明將票投給他。下列敘述何者有誤?
›
#2
當資料有正偏態時,其平均數、中位數與眾數的大小順序為何?
›
#3
當母體的觀察個數總是比樣本的觀察個數來得多,對於樣本統計量的敘述,下列何者正確?
›
#4
若 A 及 B 是獨立事件,有 $P(A)=0.65$ 及 $P(A \cap B) = 0.26$,則 $P(A \cup B)$ 之值為何?
›
#5
某一個實驗包含 3 個步驟,第一個步驟有 3 種可能的結果、第二個步驟有 5 種可能的結果、及第三個步驟有 4 種可能的結果。則可能實驗結果的總數有多少種?
›
#6
目前具有 2 年經驗電腦程式設計師的時薪已達 \$240。由於對該職業的需求遽增,人們相信該職業的時薪應該有所增加。為了確定時薪是否已經提高,其對應的假設為下列…
›
#7
隨機變數 X 的機率分配函數為 $f(X) = X/15$ for $X = 2, 3, 4$ or $6$。求 $3X+4$ 的期望值為何?
›
#8
一家汽車噴漆公司根據歷史數據發現,每部車噴漆所需時間在 45 至 90 分鐘之間呈現均勻分配。請問 1 部車噴漆所需時間不超過 1 小時的機率為何?
›
#9
關於適合度檢定(goodness of fit test),下列敘述何者正確?
›
#10
收集應變數(Y)與自變數(X)的資料並進行簡單線性迴歸分析,分析的部分訊息為:…
›
#11
進行銷售量 (Y, 單位:千元) 與銷售單價 (X, 單位:元) 的迴歸分析,產生結果:$\hat{Y} = 60 - 8X$。下列敘述何者正確?
›
#12
設 A、B、C 為樣本空間 S 之三事件,且 A、B、C 為獨立事件,已知 $P(A)=0.4$,$P(B)=0.4$,$P(C)=0.2$,求 $P((A \cup B) \cap C)$…
›
#13
簡單線性回歸分析中,已知 $SSE=500$,$SSR=300$,請問判定係數 $R^2$ 為何?
›
#14
已知組裝某機器的零件,所需時間具有平均數為 14 分鐘的指數分配。求組裝該零件所需時間不超過 7 分鐘的機率為何?
›
#15
某民調針對某候選人的支持度做調查,以電話隨機抽樣 20 歲以上民眾於 1000 份有效樣本中,顯示此候選人在 95\% 的信心水準下的信賴區間為 (0.33,…
›
#16
下列何種機率分配,其期望值等於變異數?
›
#17
有 4 組數字 $G1 = (7, 9, 9, 7, 5)$、$G2 = (7, 6, 5, 6, 7)$、$G3 = (6, 6, 6, 6, 6)$、$G4 = (3, 4, 5, 4, 3)$…
›
#18
假如 $\rho_{XY}$ 表示隨機變數 X 和 Y 的相關係數,則下列何項正確?
›
#19
在下列的敘述中,何種條件下表示有愈多的證據拒絕虛無假設?
›
#20
已知修統計學課程的學生中有 40\% 會參加統計讀書會。根據以往的資料,參加統計讀書會的學生中有 65\% 會拿到成績 A,而沒有參加統計讀書會的學生中有 10…
›
#21
下列何者不是量測資料分散程度的統計量?
›
#22
隨機抽取 49 包二砂糖,樣本平均數為 60 公斤,樣本變異數為 12.25 公斤$^2$。已知 $t_{48, 0.025} = 2.0$,$t_{48, 0.05} = 1.7$…
›
#23
一部門共有 10 位成員,其月薪 (單位:萬元) 分別為:5, 22, 6, 8, 5, 6, 7, 5, 12, 4。請問中位數為何?
›
#24
二項分配和超幾何分配之間,主要的差別在於超幾何分配具有下列何種特質?
›
#25
以 ANOVA 過程分析來自 4 個母體的資料,分別由每個母體抽出包括 30 個觀察值的樣本。此時檢定所需的 F 臨界值 (critical value),其分…
›
#26
下列何者不是維度縮減 (dimensionality reduction) 之方法?
›
#27
有關 Hadoop 的軟體疊層架構中之元素,下列何者有誤?
›
#28
下列選項何者不是 Big Data 之應用技術?
›
#29
Gartner Group 於 2012 年定義巨量資料所具備 3V 的特性,下列敘述何者有誤?
›
#30
學者 Endsley (1995) 針對決策過程所提出的處境察覺 (Situation Awareness) 模型中,決策人員察覺所處環境的 3 個狀態:① 規…
›
#31
下列何者是巨量資料領域的資料倉儲系統?
›
#32
GB、PB、TB、EB 為 4 種電腦容量的單位,若依容量由大至小的排序,下列何者正確?
›
#33
有關 K-means 集群 (clustering) 演算法,下列敘述何者有誤?
›
#34
巨量資料分析資料時,下列何者不是最常用的資料檔案格式來源?
›
#35
下列何者不是屬於 NoSQL 類型的資料儲存?
›
#36
某位數據分析師試圖自海量數據中提取潛在且有價值之資訊,此作法稱為下列何者?
›
#37
在巨量資料時代中,互聯網上所流動的網路行為資料可被用來從事許多極具價值之商業課題分析,試問下列哪一個工具無法用來捕捉網路流量?
›
#38
下列哪一選項不屬於「巨量資料」領域中所稱的資料型態特性?
›
#39
試問 apriori 關連法則演算法中,哪兩項門檻值異動最為顯著影響資料探勘法則之數量?
›
#40
下列資料何者為結構化資料 (Structured Data)?
›
#41
關於 ETL 三個步驟的正確英文全名,下列何者正確?
›
#42
在眾多巨量資料儲存作為中,若將同一份資料以副本方式分別存放在 5 個不同的場域,此舉主要是希望落實下列哪一個選項?
›
#43
關於巨量資料領域常使用到的集群分析演算法具體作為,下列選項何者有誤?
›
#44
以巨觀的觀點,請將以下各個階段:① 資料分析或知識挖掘 ② 資料組織 ③ 資料視覺化或報告 ④ 資料收集與準備,按照巨量資料管道 (pipelines) 的正確…
›
#45
假設您取得了一份含有 500 位顧客資料的表單,其中的資料欄位包括顧客編號、生日、居住地、交易額,試問此表單最為滿足 R 語言中的哪一種資料結構?
›
#46
MapReduce 是由 Google 所提出的一個巨量資料運算架構,試問下列哪一個選項正確表達該架構的資料輸入至輸出之順序?
›
#47
關於資料標準化,下列敘述何者有誤?
›
#48
請問下列何者等於 1 個 EB (Exabyte)?
›
#49
關於 Python 語言的特性,下列敘述何者有誤?
›
#50
下列有關深度學習 (Deep Learning) 之敘述,何者有誤?
›