105年moea_joint 統計學、巨量資料概論考古題

#1 下列對Poisson分配的敘述，何者正確？ I: 所有的Poisson分配為正偏態(positive skewness) II: Poisson分配的期望值和標… ›

#2 一簡單隨機樣本，其$\bar{X}$ 抽樣分配的特徵(平均數、變異數和分配形狀)，容易受到下列何者之影響？ I: 樣本大小 II: 母體的變異數 III:… ›

#3 下列敘述何者正確？ I: 若 $X \sim N(\mu, \sigma^2)$，令 $Y = X - \mu$，則 $Y \sim N(0, \sigma^2)$… ›

#4 令 $S_1, S_2$ 分別為母體平均數 $\mu$ 的二個估計量(estimator)，又知道 $\mu = 10$。對一已知的樣本數，$S_1$ 抽樣分配… ›

#5 某一分析家利用 500 個家庭的隨機樣本，估計家庭平均月收入的 90 % 信賴區間為 $60000 \le \mu \le 80000$。若分析家想以 99 %… ›

#6 下列哪些機率分配為離散(discrete)分配？ I: 超幾何 II: 指數 III: 二項 IV: 幾何 ›

#7 某一自助餐餐廳的主菜，分成四大類：豬肉、雞肉、海鮮和其他。隨機抽取 700 位顧客，所點之主菜結果如下： | 主菜 | 豬肉 | 雞肉 | 海鮮 | 其他 |… ›

#8 在研究市場報酬率($X$)和甲股票報酬率($Y$)的一簡單線性回歸中，有下列的結果：… ›

#9 某一影印機每 100 頁中印壞 1 張，若某僱員要影印 500 頁的報告，則在影印過程中沒有印壞的機率為何？ ›

#10 $X, Y$ 為二個隨機變數，已知 $Var(2X - Y) = 32, Var(Y) = 4, Cov(X, Y) = -3$，則 $X$ 和 $Y$ 的相關… ›

#11 在隨機完全區集設計(Randomized complete block design)有 4 個處理分佈在 6 個區集中，下列為其變異數分析表的部分結果，請問處… ›

#12 使用自然的地理位置或是其他界線將母體區分為許多區塊，並在每一個區塊中進行簡單隨機抽樣來組成樣本，此種抽樣方法稱為？ ›

#13 在假設檢定時，如果虛無假設為真，不拒絕虛無假設的機率是 0.95，如果虛無假設為假，拒絕虛無假設的機率是 0.9，則下列敘述何者有誤？ ›

#14 有一個隨機變數 $X$，其機率分配如下：… ›

#15 下列哪一種統計圖可以決定第 90 百分位數的大約位置？ ›

#16 下表列示了一組隨機樣本的資料，其相關係數為何？ | X | 27 | 31 | 16 | 8 | 11 | |---|---|---|---|---|---|… ›

#17 從一組母體中選取 68 個觀察值為樣本，樣本平均數是 1.72、樣本標準差是 0.64。另從第二組母體中選取 33 個觀察值為樣本，樣本平均數是 0.82、樣本… ›

#18 關於卡方檢定 (Chi-square Test) 之適用，下列何種有誤？ ›

#19 關於二因子變異數分析中檢定的敘述，下列何者正確？ ›

#20 已知 $P(A) = 0.35, P(B|A) = 0.4$，則 $P(A \cap B^c)$ 為多少?(其中 $B^c$ 為事件 $B$ 的餘事件) ›

#21 關於複回歸分析，下列敘述何者正確？ ›

#22 下列何者為母體參數？ ›

#23 等式 $SS(Total) = SST(treatment) + SSB(block) + SSE$ 適用於哪一種實驗設計模型？ ›

#24 關於 Tukey 多重比較的用途，下列何者正確？ ›

#25 要決定資料是否來自於特定多項分配(Multinomial distribution)時，我們要選用哪一種檢定？ ›

#26 費林分類法(Flynn’s Taxonomy)是一種計算機架構的分類方式，根據指令和資料的相對關係，可以區分為四種，如以單一處理器來執行單一程式段落及單一資料的… ›

#27 在 CUDA(Compute Unified Device Architecture) 中，memory 的分配上是相當重要的問題，GPU 上具有 shared… ›

#28 在 CUDA(Compute Unified Device Architecture) 程式編寫中，如果我們要給每一個 thread 唯一的 ID，起始值為 0… ›

#29 關於資料庫中使用的索引結構，下列何者有誤？ ›

#30 關於支持向量機(Support Vector Machine, SVM)，下列敘述何者有誤？ ›

#31 隨著巨量資料成為許多公司的競爭優勢，所有產業的架構也將重新調整，關於巨量資料對企業的影響，下列敘述何者有誤？ ›

#32 分析巨量社群網路資料時，下列敘述何者有誤？ ›

#33 關於機器學習演算法，下列敘述何者有誤？ ›

#34 關於巨量資料的特色，下列敘述何者有誤？ ›

#35 關於衡量機器學習中分類器(Classifier)效能的指標，下列何者有誤？ ›

#36 關於從社群網站抓取社群網路拓撲(Social Network Topology)資料，下列敘述何者有誤？ ›

#37 關於巨量資料分析常使用的 NoSQL 資料庫，下列敘述何者有誤？ ›

#38 對於兩事件 A, B 的關聯式規則(Association Rule)，下列敘述何者有誤？ ›

#39 關於分群演算法(Clustering)，下列敘述何者正確？ ›

#40 關於 MapReduce model，下列敘述何者有誤？ ›

#41 關於 HDFS 架構，下列敘述何者有誤？ ›

#42 下列何種方法比較不適合進行平行化？ ›

#43 根據巨量資料分析的資料屬性，下列何者與其他屬性差異最大？ ›

#44 我們會定義資料為巨量、大或者海量，最主要的原因，是目前的資訊科技環境，提供了以下何種重要特性，使其稱為 Big Data？ ›

#45 Spark 的 Word Count 程式片段範例如下所示，下列敘述何者有誤？ text_file = sc.textFile("hdfs://...") co… ›

#46 在巨量資料的想法中，強調的是去尋找事件或事物的相互關係(Correlation)，非著重在傳統因果關係(Causality)的尋找，主要是因為當今環境變遷迅速，… ›

#47 於巨量資料當中進行關聯規則的探勘(Association Rule Mining)，採用 Apriori 的方法，將會於每階段產生大量的組合，使得計算顯得沒有效… ›

#48 在巨量資料的技術堆疊中，哪一層將透過 MapReduce，慣用程式碼的額外處理與建構中介資料結構，諸如：統計模型或資料立方體...等，所產生的結構，做為額外分析… ›

#49 雲端運算技術是巨量資料處理的基礎，關於雲端運算技術，下列敘述何者正確？ ›

#50 下列哪一個項目不是 Google 於 2003~2006 年前後，發表奠定巨量資料技術理論基石的技術？ ›

105年moea_joint — 統計學、巨量資料概論