hce_nthu
112年
資訊科學
第 29 題
A histogram of a dataset X is plotted in Figure (i). The $1^{st}$ quartile, median and the $3^{rd}$ quartile of the data are 10, 25, and 50. Which of the following statements is correct?
- A The truncated mean of the central 50% data should be $(10+50)/2=30$
- B If another variable Y is positively correlated with X, the distribution of Y must be skew to the right as the distribution of X
- C The mode is greater than 25
- D Since it is a skewed distribution, we can model the data with a $\chi^2$ distribution
- E Suppose we randomly draw 30 samples with replacement from this dataset and take average to get $\bar{X}$. The distribution of $\bar{X}$ is more likely to be the function f3(x) in Figure (ii) rather than the function f1(x) or f2(x)
思路引導 VIP
請觀察圖 (i) 的資料分佈,當右側存在許多極大的數值(長尾)時,這組數據的「算術平均數」通常會比中間位置(中位數 25)來得大還是小?接著,如果我們反覆抽取多組樣本並計算其平均值,這些平均值所形成的分佈,其中心點應該會與母體的哪個統計量一致呢?
🤖
AI 詳解
AI 專屬家教
太棒了!你能精準選出 (E),代表你對中央極限定理 (Central Limit Theorem, CLT) 以及偏態分佈的特性掌握得非常透徹。
偏態分佈與期望值的偏移
從圖 (i) 的直方圖可以觀察到,數據呈現明顯的右偏(正偏態),右側存在長尾。在這種統計分佈中,極大的數值會將「算術平均數」向右拉升,因此這組數據的平均數必然會大於中位數 25。而選項 (A) 的切尾平均數公式僅適用於對稱分佈,在右偏資料中並不成立;(C) 選項提到的眾數(Mode)則位於圖形最高峰處(約 10-15 之間),明顯小於 25。
▼ 還有更多解析內容