moea_joint
105年
統計學、巨量資料概論
105年moea_joint — 統計學、巨量資料概論
共 50 題 · 含 AI 詳解
-
#1
下列對Poisson分配的敘述,何者正確?
I: 所有的Poisson分配為正偏態(positive skewness)
II: Poisson分配的期望值和標…
›
#2
一簡單隨機樣本,其$\bar{X}$ 抽樣分配的特徵(平均數、變異數和分配形狀),容易受到下列何者之影響?
I: 樣本大小 II: 母體的變異數 III: 母體…
›
#3
下列敘述何者正確?
I: 若 $X \sim N(\mu, \sigma^2)$,令 $Y = X - \mu$,則 $Y \sim N(0, \sigma^2)$…
›
#4
令 $S_1, S_2$ 分別為母體平均數 $\mu$ 的二個估計量(estimator),又知道 $\mu = 10$。對一已知的樣本數,$S_1$ 抽樣分配…
›
#5
某一分析家利用 500 個家庭的隨機樣本,估計家庭平均月收入的 90 % 信賴區間為 $60000 \le \mu \le 80000$。若分析家想以 99 %…
›
#6
下列哪些機率分配為離散(discrete)分配?
I: 超幾何 II: 指數 III: 二項 IV: 幾何
›
#7
某一自助餐餐廳的主菜,分成四大類:豬肉、雞肉、海鮮和其他。隨機抽取 700 位顧客,所點之主菜結果如下表。想檢定個別的母體比例,依序主菜四大類分別為 0.5、0…
›
#8
在研究市場報酬率($X$)和甲股票報酬率($Y$)的一簡單線性回歸中,有下列的結果:…
›
#9
某一影印機每 100 頁中印壞 1 張,若某僱員要影印 500 頁的報告,則在影印過程中沒有印壞的機率為何?
›
#10
$X, Y$ 為二個隨機變數,已知 $Var(2X - Y) = 32, Var(Y) = 4, Cov(X, Y) = -3$,則 $X$ 和 $Y$ 的相關…
›
#11
在隨機完全區集設計(Randomized complete block design)有 4 個處理分佈在 6 個區集中,下列為其變異數分析表的部分結果,請問處…
›
#12
使用自然的地理位置或是其他界線將母體區分為許多區塊,並在每一個區塊中進行簡單隨機抽樣來組成樣本,此種抽樣方法稱為?
›
#13
在假設檢定時,如果虛無假設為真,不拒絕虛無假設的機率是 0.95,如果虛無假設為假,拒絕虛無假設的機率是 0.9,則下列敘述何者有誤?
›
#14
有一個隨機變數 $X$,其機率分配如下:…
›
#15
下列哪一種統計圖可以決定第 90 百分位數的大約位置?
›
#16
下表列示了一組隨機樣本的資料,其相關係數為何?
›
#17
從一組母體中選取 68 個觀察值為樣本,樣本平均數是 1.72、樣本標準差是 0.64。另從第二組母體中選取 33 個觀察值為樣本,樣本平均數是 0.82、樣本…
›
#18
關於卡方檢定 (Chi-square Test) 之適用,下列何種有誤?
›
#19
關於二因子變異數分析中檢定的敘述,下列何者正確?
›
#20
已知 $P(A) = 0.35, P(B|A) = 0.4$,則 $P(A \cap B^c)$ 為多少?(其中 $B^c$ 為事件 $B$ 的餘事件)
›
#21
關於複回歸分析,下列敘述何者正確?
›
#22
下列何者為母體參數?
›
#23
等式 $SS(Total) = SST(treatment) + SSB(block) + SSE$ 適用於哪一種實驗設計模型?
›
#24
關於 Tukey 多重比較的用途,下列何者正確?
›
#25
要決定資料是否來自於特定多項分配(Multinomial distribution)時,我們要選用哪一種檢定?
›
#26
費林分類法(Flynn’s Taxonomy)是一種計算機架構的分類方式,根據指令和資料的相對關係,可以區分為四種,如以單一處理器來執行單一程式段落及單一資料的…
›
#27
在 CUDA(Compute Unified Device Architecture) 中,memory 的分配上是相當重要的問題,GPU 上具有 shared…
›
#28
在 CUDA(Compute Unified Device Architecture) 程式編寫中,如果我們要給每一個 thread 唯一的 ID,起始值為 0…
›
#29
關於資料庫中使用的索引結構,下列何者有誤?
›
#30
關於支持向量機(Support Vector Machine, SVM),下列敘述何者有誤?
›
#31
隨著巨量資料成為許多公司的競爭優勢,所有產業的架構也將重新調整,關於巨量資料對企業的影響,下列敘述何者有誤?
›
#32
分析巨量社群網路資料時,下列敘述何者有誤?
›
#33
關於機器學習演算法,下列敘述何者有誤?
›
#34
關於巨量資料的特色,下列敘述何者有誤?
›
#35
關於衡量機器學習中分類器(Classifier)效能的指標,下列何者有誤?
›
#36
關於從社群網站抓取社群網路拓撲(Social Network Topology)資料,下列敘述何者有誤?
›
#37
關於巨量資料分析常使用的 NoSQL 資料庫,下列敘述何者有誤?
›
#38
對於兩事件 A, B 的關聯式規則(Association Rule),下列敘述何者有誤?
›
#39
關於分群演算法(Clustering),下列敘述何者正確?
›
#40
關於 MapReduce model,下列敘述何者有誤?
›
#41
關於 HDFS 架構,下列敘述何者有誤?
›
#42
下列何種方法比較不適合進行平行化?
›
#43
根據巨量資料分析的資料屬性,下列何者與其他屬性差異最大?
›
#44
我們會定義資料為巨量、大或者海量,最主要的原因,是目前的資訊科技環境,提供了以下何種重要特性,使其稱為 Big Data?
›
#45
Spark 的 Word Count 程式片段範例如下所示,下列敘述何者有誤?
```
text_file = sc.textFile("hdfs://..."…
›
#46
在巨量資料的想法中,強調的是去尋找事件或事物的相互關係(Correlation),非著重在傳統因果關係(Causality)的尋找,主要是因為當今環境變遷迅速,…
›
#47
於巨量資料當中進行關聯規則的探勘(Association Rule Mining),採用 Apriori 的方法,將會於每階段產生大量的組合,使得計算顯得沒有效…
›
#48
在巨量資料的技術堆疊中,哪一層將透過 MapReduce,慣用程式碼的額外處理與建構中介資料結構,諸如:統計模型或資料立方體...等,所產生的結構,做為額外分析…
›
#49
雲端運算技術是巨量資料處理的基礎,關於雲端運算技術,下列敘述何者正確?
›
#50
下列哪一個項目不是 Google 於 2003~2006 年前後,發表奠定巨量資料技術理論基石的技術?
›