106年moea_joint 統計學、巨量資料概論考古題

#1 隨機變數Ｘ服從一個參數為n和p的二項分配，下列敘述何者有誤？ ›

#2 我們想驗證台灣年輕人每星期花在精靈寶可夢(Pokémon Go)線上遊戲的平均時間是否為20小時，即在給定顯著水準 $\alpha$ 下檢定 $H_0: \mu = 20$… ›

#3 以下ANOVA表為單一變數簡單廻歸分析的結果，令Y為反應變數，X為解釋變數，反應變數Y有多少百分比的變異量可以由變數X來解釋？ ›

#4 由最小平方法得到的廻歸方程式為 $Y = 3.5 - 6X$，下列敘述何者有誤？ ›

#5 在具有多個自變數的複廻歸分析中，若同時考料模型的複雜度和解釋能力，以下那一個變量最適合用來當作模型選取的依據？ ›

#6 假設台北市的全體居民平均每1,000之中有1人為原住民。如果我們採用置回抽樣(sampling with replacement)隨機查訪8,000位台北市居民… ›

#7 如果某一母體具有常態分布，其變異數為 $\sigma^2$，而我們想要檢定虛無假設 $H_0: \sigma^2 = \sigma_0^2$ 的真偽($\sigma_0^2$… ›

#8 假設兩個隨機變數 X 與 Y 的聯合機率分布可表列如下：令 $Cov(X, Y)$ 為 X 與 Y 的共變異數，下列敘述何者正確？ ›

#9 假設 $\hat{\theta}$ 為母體之中某參數 $\theta$ 的一個點估計量(point estimator)，則 $\hat{\theta}$ 之均… ›

#10 某汽車公司為瞭解顧客群對於不同車型之喜好程度是否與性別有關聯性，隨機查訪150人作樣本，得到以下的列聯表(contingency table)樣本數據，若設定顯… ›

#11 已知 $P(A) = 1/5$、$P(B) = 2/5$，且事件 A 和事件 B 獨立，則 $P(A \cup B) = ？$ ›

#12 若事件 A 和事件 B 為相依事件，下列敘述何者正確？ ›

#13 從一副橋牌中，以不放回方式依序抽取出 8 張牌，想計算這抽出的 8 張牌中有 3 張是 10 點的機率，應該使用哪種分配？ ›

#14 對常態分配而言，下列敘述何者正確？ ›

#15 已知樣本 $n = 324$ 和母體標準差 $\sigma = 9$，則在 95 % 信心水準下，最大的估計誤差是？($Z_{0.05}=1.645$；$Z_{0.025}=1.96$… ›

#16 某老師想了解學生寫作業的平均時間是多少，已知母體標準差 $\sigma = 30$ 分鐘，則在 95 % 信心水準和估計誤差至多 10 分鐘下，需要多大的樣本？… ›

#17 下列何種情形將拒絕虛無假設($H_0$)？ ›

#18 型 I 誤差(Type I Error)的意思為下列何者？ ›

#19 計算列聯表(contingency table)的卡方值(Chi-Square value)，當這個值很小時，說明這兩個變數間可能的關係是下列何者？ ›

#20 令隨機變數 Z 服從標準常態分布、隨機變數 T 服從自由度(degrees of freedom)為 9 的 t 分布，而 $f_Z(z)$、$f_T(t)$… ›

#21 完全隨機集區設計(Randomized Block Design)下，總變異(SSTO)，處理變異(SSTR)，集區變異(SSBL)和誤差變異(SSE)間的關係… ›

#22 一因子變異數分析(One-Way ANOVA)中，有 3 個處理，每個處理有 5 個觀察值，則誤差項的自由度為多少？ ›

#23 若簡單迴歸方程式中相關係數等於 0.8，則其斜率(Slope)值是下列何者？ ›

#24 某君每天喝一杯咖啡，且其只喝黑咖啡跟拿鐵。如果他今天喝黑咖啡，則明天會喝黑咖啡的機率是 0.3，喝拿鐵的機率是 0.7；如果他今天喝拿鐵，則明天會喝黑咖啡或喝拿… ›

#25 若成功的機率為 50 %，試求 50 次獨立實驗下得到 20 次成功的機率為下列何者？ ›

#26 下列哪項不是 Hadoop 之特性？ ›

#27 下列哪項不是 Apache Spark 2.0 所支援的程式語言？ ›

#28 在類神經網路(Neural Network)分類器中，一個 sigmoid node 的輸出數值是下列何者？ ›

#29 有關類神經網路(Neural Network)之敘述，下列何者有誤？ ›

#30 有關應用卷積神經網路(Convolutional Neural Networks，簡稱 CNNs)於影像分析之敘述，下列何者正確？ ① 較前面的處理層 (Lay… ›

#31 有關分析巨量社群網路資料之敘述，下列何者有誤？ ›

#32 有關頻繁樣式探勘(Frequent Pattern Mining) 之敘述，下列何者有誤？ ›

#33 巨量資料庫管理最常用的操作包含 Selection、Projection、Union 與 Intersection。對於此 4 種資料庫操作，若想實作在 Had… ›

#34 在資料分析中，經常遇到一分類或預測模型產生高或低的偏差(Bias) 與變異性(Variance)。以下有 4 個關於模型偏差與變異數之敘述，下列何者正確？ ①… ›

#35 下列何種資料格式經常被定義為半結構化資料(Semi-structured Data)？ ›

#36 在巨量資料分析專案中，下列何者比較無助於提升分類模型準確度(Accuracy)？ ›

#37 下列的統計學習(Statistical Learning)方法經常被用於分析巨量資料，請問何者應用的領域問題與其它不同？ ›

#38 有關隨機森林(Random Forests)之敘述，下列何者正確？ ›

#39 在統計學習(Statistical Learning)方法論中，有關模型的過適(Overfitting)之敘述，下列何者有誤？ ›

#40 有關近年來巨量資料處理與分析的發展，下列何者有誤？ ›

#41 有關巨量資料分析的平台環境建置之敘述，下列何者正確？ ›

#42 有關 MapReduce 程式模型(Programming Model)之敘述，下列何者有誤？ ›

#43 有關統計學習(Statistical Learning)中的非監督式學習(Unsupervised Learning)方法，下列敘述何者有誤？ ›

#44 下列統計學習(Statistical Learning)的方法或過程，何者不易受到變數尺度(Scale)不同的影響？ ›

#45 如何降低模型過適(Overfitting)問題？ ›

#46 資料前處理在資料探勘是一個非常重要的步驟，下列哪一個步驟不屬於資料前處理？ ›

#47 在 Hadoop 中，下列何者為有效的資料分析流程？ ›

#48 資料視覺化是資料處理中一項重要工作，通常資料視覺化需要使用到下列哪種方法？ ›

#49 下列何者並非 Hadoop 與 Spark 共同擁有的特色？ ›

#50 下列哪項不是主成分分析(Principal Component Analysis)之特性？ ›

106年moea_joint — 統計學、巨量資料概論