moea_joint
111年
統計學、巨量資料概論
111年moea_joint — 統計學、巨量資料概論
共 50 題 · 含 AI 詳解
-
#1
在統計學概念及方法中,下列哪些會受極端值影響?
① 中位數 ② 平均數 ③ 迴歸直線的係數 ④ 全距 ⑤ 眾數 ⑥ 四分位數距(IQR)
›
#2
已知箱中置有 4 顆藍色球、6 顆紅色球及 n 顆白色球。參加者自箱中抽出 1 球,確定顏色後放回。若抽得藍色球者可得 1,000 元,抽得紅色球者可得 2,0…
›
#3
某校有 1,000 位學生,英文段考成績呈常態分布,平均成績 70 分,標準差 10 分。請問此次段考成績超過 90 分的學生人數最靠近下列哪個數值?
註:…
›
#4
欲求常態母體平均數 $\mu$ 的信賴區間,抽取 1 組樣本數為 30 的隨機樣本。假設母體標準差未知,若信心水準不變,但樣本數增加為原本的 9 倍,而樣本標準…
›
#5
欲檢定虛無假設 $H_0: \mu = 25$ 與對立假設 $H_A: \mu < 25$,自標準差未知的常態分布中選取 1 組大小為 n 的隨機樣本,下列哪個…
›
#6
在正斜分配資料中,下列何者正確?
›
#7
有關 P-值(P-value)之敘述,下列何者正確?
›
#8
若已知 X 和 Y 兩變數之線性迴歸方程式為 $\hat{y} = 1.05 + 0.80x$,且…
›
#9
某市調公司欲探討 3 家飲料廠商(A、B、C)之市場佔有率是否相等。今自市場者中隨機抽取 120 位消費者,發現其中是 A、B、C 廠商的消費者分別為 50、4…
›
#10
欲檢定 100 個隨機樣本是否來自均勻分配,假設隨機變數的可能範圍為已知,並據此範圍以等間距的方式分成 5 組。假設第 i 組的觀察個數為 $O_i$,使用卡方…
›
#11
假設隨機抽取 1 組樣本數等於 100 的樣本,發現樣本平均數是 10、樣本標準差是 10,根據中央極限定理(Central Limit Theorem),上述…
›
#12
假設已知某個城市有 60 % 的大學生有打工經驗,也發現該城市有 70 % 的大學生有意願再繼續就讀研究所。若使用簡單隨機抽樣,由該城市的大學生中抽出 1 位同…
›
#13
假設隨機變數 x 的平均數為 15,標準差為 4,若 $y = 2x, z = x + 15$,以下敘述何者正確?
›
#14
若因子變異數分析如下表,則甲、乙、丙之值,下列何者有誤?
›
#15
某知名人士想競選民意代表,但不清楚自己的民意基礎為若干,於是以抽樣方式了解他的支持度 p。若估計誤差不超過 3 %,請問需要抽多少樣本(請以 95 % 信心水準…
›
#16
某候選人希望能提前自行宣布勝選,因此進行出口民調及統計檢定。隨機訪問 400 位該區已投票的民眾,其中 228 位投給該候選人。已知得票率需大於 50 % 才勝…
›
#17
在 1 所大學抽取 100 位學生隨機樣本之平均 GPA 為 3.1,若用上述結果來估計此大學所有學生之平均 GPA,則是在作下列哪一項統計?
›
#18
下列資料為 500 件發生在星期六晚上之意外事件分析,其中牽涉到酒駕與 1 輛汽車之意外事件比例為何?
›
#19
某所高中三年級學生的數學成績近似於具有平均數 300 分與標準差 35 分的常態分配。藉由簡單隨機抽樣,選取 4 位高中三年級學生,他們的平均成績高於 335…
›
#20
在最近針對 100 名小學六年級學生的研究中,得知他們每週平均看電視的時間是 20 小時,標準差為 5 小時,請問全體六年級學生每週平均看電視時間的 95 %…
›
#21
從蒐集來的 100 個樣本資料值計算得到 $\sum X_i = 300$ 及 $\sum X_i^2 = 925$,則其變異係數為何?
›
#22
有 3 法則可決定結果發生機率,包含古典法則、相對次數法及主觀認定法。請問下列 3 種情形,分別依據哪一種法則認定?
① 美國人將贏明年法國公開賽
② 公平骰子…
›
#23
有關 F 分配百分位數之說法,下列何者正確?
›
#24
在線性迴歸模式中,相較於 y 特定值之區間估計,y 平均值之區間估計,下列何者正確?
›
#25
1 個社區大學有 150 台 PC,1 天任 1 台要修之機率為 0.025。為求剛好 25 台 PC 要修之機率,應使用下列何種機率分配近似求原機率?
① 二…
›
#26
下列何者非屬關聯式資料庫(Structured Query Language, SQL)的資料模型?
›
#27
下列何者非屬使用巨量資料處理技術之主要目的?
›
#28
Spark 巨量資料處理技術所使用的主要資料模型是彈性分散式資料集(Resilient Distributed Dataset, RDD),下列何者不是 RDD…
›
#29
下列關聯式資料庫一致性屬性之概念,何者正確?
›
#30
下列何者非屬 MapReduce 的主要計算動作?
›
#31
下列何者非屬盲信號分離技術?
›
#32
巨量資料由於數量大與特徵多元的特性,若適當透過探索式資料分析的技巧,能幫助我們了解資料的多種隱含現象,但不包含下列哪一個項目?
›
#33
卷積神經網路中將輸入的資料劃分為若干個矩形區域,對每個子區域輸出最大值,此機制為哪個網路層的運作目的?
›
#34
特徵選擇主要目的是從資料集中選出最重要或最相關的特徵,來給機器學習建立模型,下列何者非屬特徵選擇的方法?
›
#35
Apache Hadoop 系統是由下列何者領導進行開發案?
›
#36
如果有 3 位候選人競選台北市長,最後 3 人得票數很接近時,依照 Information Theory 的理論,此事件之 Entropy 值應該接近下列何者?
›
#37
針對數學模型:$Y = a_1 X_1 + a_2 X_2 + a_3 X_3$,如果 Y 是類別型變數(Categorical Variable),則該模型適…
›
#38
關於 MapReduce 程式設計與運算,下列敘述何者有誤?
›
#39
雲端運算上,NameNode 非常重要,當 NameNode 壞掉時,所有資料儲存地址都會消失,導致資料會全部遺失。下列預防 NameNode 壞掉之方式,何者…
›
#40
一般會要求 Spark 的使用者將 RDD(Resilient Distributed Dataset)變數宣告為唯讀性質的 val,原因是下列何者?
›
#41
進行資料分群時,下列敘述何者表示好的分群結果?
›
#42
有關資料前處理方法-獨熱編碼(One-Hot-Encoding, OHE),下列敘述何者有誤?
›
#43
Gmail 屬於下列何者服務?
›
#44
對於 1 年份刷卡資料,欄位有時間、店名、物品、刷卡金額及付款方式,若要使用 MapReduce 得到每家店此年銷售總額,請問應該使用下列何種 Key-Valu…
›
#45
對於為什麼 HDFS 的檔案塊(Blocks)預設成 128MB 為最佳狀態之敘述,下列何者正確?
›
#46
人工智慧(AI)、深度學習(DL)與機器學習(ML)之關係為下列何者?
›
#47
有關使用深度學習(Deep Learning)於序列資料中,下列敘述何者有誤?
›
#48
視覺化是從巨量資料中得到洞見之重要工具,若我們想對於不同職業之平均收入繪圖,使用下列何圖較合適?
›
#49
強化學習(Reinforcement Learning)容易應用在遊戲,而較難應用在真實世界的主要原因,下列何者正確?
›
#50
當雲端叢集有 1 個 DataNode 故障時,系統將進行何種操作?
›