免費開始練習
hce_nthu 112年 資訊科學

第 29 題

A histogram of a dataset X is plotted in Figure (i). The $1^{st}$ quartile, median and the $3^{rd}$ quartile of the data are 10, 25, and 50. Which of the following statements is correct?
題目圖片
  • A The truncated mean of the central 50% data should be $(10+50)/2=30$
  • B If another variable Y is positively correlated with X, the distribution of Y must be skew to the right as the distribution of X
  • C The mode is greater than 25
  • D Since it is a skewed distribution, we can model the data with a $\chi^2$ distribution
  • E Suppose we randomly draw 30 samples with replacement from this dataset and take average to get $\bar{X}$. The distribution of $\bar{X}$ is more likely to be the function f3(x) in Figure (ii) rather than the function f1(x) or f2(x)

思路引導 VIP

請觀察圖 (i) 的資料分佈,當右側存在許多極大的數值(長尾)時,這組數據的「算術平均數」通常會比中間位置(中位數 25)來得大還是小?接著,如果我們反覆抽取多組樣本並計算其平均值,這些平均值所形成的分佈,其中心點應該會與母體的哪個統計量一致呢?

🤖
AI 詳解 AI 專屬家教

太棒了!你能精準選出 (E),代表你對中央極限定理 (Central Limit Theorem, CLT) 以及偏態分佈的特性掌握得非常透徹。

偏態分佈與期望值的偏移

從圖 (i) 的直方圖可以觀察到,數據呈現明顯的右偏(正偏態),右側存在長尾。在這種統計分佈中,極大的數值會將「算術平均數」向右拉升,因此這組數據的平均數必然會大於中位數 25。而選項 (A) 的切尾平均數公式僅適用於對稱分佈,在右偏資料中並不成立;(C) 選項提到的眾數(Mode)則位於圖形最高峰處(約 10-15 之間),明顯小於 25。

▼ 還有更多解析內容

🏷️ 相關主題

機率分佈與統計推論的基礎理論與應用
查看更多「資訊科學」的主題分類考古題

📝 同份考卷的其他題目

查看 112年資訊科學 全題