moea_joint
113年
統計學、巨量資料概論
113年moea_joint — 統計學、巨量資料概論
共 50 題 · 含 AI 詳解
-
#1
袋子中有2個紅球、3個黑球、5個白球,每次從袋中抽出1球後放回,共抽3次,請問3球中有2個是紅球之機率為何?
›
#2
大學生打工之比例為0.3,若隨機抽取3位大學生,其中至少2位有打工之機率為何?
›
#3
欲比較兩公司員工薪資之離散程度,可採用下列何者統計量?
›
#4
假設A、B為樣本空間S之兩事件,下列何者與其他敘述之意義不同?
›
#5
已知$E(X + 4) = 10$ 且 $E[(X + 4)^2] = 116$,試求Var(X)為何?
›
#6
均方根誤差(RMSE)是藉以衡量下列何者?
›
#7
下列何種圖表最適合用來顯示資料隨著時間變化之趨勢?
›
#8
颱風正接近台灣,某地方首長須決定次日是否停班停課,故設立2個假設為$H_0$:颱風會登陸、$H_1$:颱風不會登陸。以「該放假而不放假」之情形,係犯何種型態錯誤…
›
#9
若右尾檢定的顯著水準($\alpha$值)愈小,下列何者正確?
›
#10
下列何者屬於古典迴歸分析之基本假設? 匣:誤差項服從常態、②:誤差項彼此不相關、丙:反應變數Y服從常態分配、㉠:解釋變數間不相關。
›
#11
當A、B的共變異數(Covariance) Cov[A, B] =5時,試求 Cov[2A, B + 1]為何?
›
#12
若有4家供應商提供原料,欲檢定此4家原料平均數是否相等,可用下列何種檢定?
›
#13
下列何者受離群值(outliers)的影響最小?
›
#14
有關迴歸模式(Regression Models)的最小平方估計法(Least Square Estimation),下列敘述何者正確?
›
#15
某資料分配的偏態係數(Coefficient of Skewness) = -3,請問該資料分配的平均數、中位數與眾數的順序關係為何?
›
#16
有關信賴區間之敘述,下列何者有誤?
›
#17
根據過去資料顯示,某公司員工離職人數為常態分配,其A、B兩區分公司員工離職人數標準差相同,均為2人/年,若A、B兩區各隨機抽取8家分公司,其平均員工離職人數分別…
›
#18
假設$X_1, ..., X_n$係一組來自母體平均數為$\mu$、母體變異數為$\sigma^2$的隨機樣本,下列敘述何者有誤?
›
#19
有關 t 分配與常態分配的峰態係數,下列敘述何者正確?
›
#20
統計學家證實,要提高抽樣的準確度,最好的方式為下列何者?
›
#21
假設某隨機變數X服從平均數為10的卜瓦松分配(Poisson Distribution),若自其中隨機抽取100個觀察值構成樣本平均數,請問此統計量服從的抽樣分…
›
#22
若樣本資料(4, 6, 6, 8, 10, 14)等6個數值來自於相同的對稱分配,根據此樣本,母體中位數最佳不偏估計元的數值為何?
›
#23
檢定母體平均數時,若母體為常態分布且小樣本,下列敘述何者正確?
›
#24
若於一複迴歸分析中使用100個觀察值得到下列迴歸估計式,其總平方和SST = 1075,誤差平方和SSE=275,試求迴歸均方MSR為何?…
›
#25
某常態分布之母體,其變異數為$\sigma^2$,欲檢定虛無假設$H_0: \sigma^2=\sigma_0^2$的真偽($\sigma_0^2$為一定數),…
›
#26
有關統計與機器學習的差異,下列敘述何者正確?
›
#27
下列何者非屬資料前處理(Data Preprocessing)的一環?
›
#28
何謂結構化資料(Structured Data) ?
›
#29
下列何者非屬低品質的資料?
›
#30
下列何者非屬分群的應用範圍?
›
#31
下列何者非屬離群值的處理方式?
›
#32
Spark 的DAG(Directed Acyclic Graph)在資料處理之作用,下列何者正確?
›
#33
下列何者非屬群集分析(Clustering Analysis)的4個主要階段?
›
#34
有關巨量資料的長尾效應(Long Tail Effect),下列敘述何者正確?
›
#35
在資料分群中,用以確定最佳聚類數量的技術為何?
›
#36
何謂遷移學習(Transfer Learning)?
›
#37
Apache Spark在巨量資料環境中的主要用途為何?
›
#38
何謂交叉驗證(Cross-Validation)?
›
#39
有關自然語言處理(NLP)之步驟,下列何者正確?
›
#40
在機器學習演算法中,下列何者最能避免過度配適(Overfitting) ?
›
#41
在Hadoop中,HDFS的資料冗餘機制為何?
›
#42
假設使用半導體晶圓資料,良率資料之反應值以二元類別表示,請問上述情境最適合使用何種分析技巧?
›
#43
在資料進行機器學習的過程中,正規化(Regularization)係指下列何者?
›
#44
下列何種機器學習技術適合偵測大型資料集中的異常值(Anomalies)?
›
#45
下列何種神經網路架構最適合分析序列資料,如時間序列或自然語言?
›
#46
下列何者為使用機器學習時須注意之事項?
›
#47
有關支持向量機(Support Vector Machine)中的「核技巧」(Kernel Trick),其作用為下列何者?
›
#48
在ETL 過程中,Transform 主要功能是將抽取之資料進行轉換,下列何者非屬其主要任務?
›
#49
生成對抗網路(GAN)較常應用在下列何種技術上?
›
#50
下列何種技術可實現即時分析?
›