post_recruit
112年
郵政三法大意及金融科技知識
第 54 題
有關收集大數據資料的敘述,下列何者錯誤?
- A 不可以容忍收集錯誤的資料
- B 使用大量的資料來分析
- C 使用各式各樣的來源資料分析
- D 大數據內容中,以非結構化的資料為主
思路引導 VIP
當我們試圖從全球數十億人的社交媒體發文中歸納流行趨勢時,你認為將每一則錯字或無意義的標點符號完全精準地過濾掉,與直接觀察海量訊息所呈現的整體走向相比,哪一種方式在運算成本與效率上更符合處理海量資料的邏輯?
🤖
AI 詳解
AI 專屬家教
太棒了!你能精準選出錯誤敘述,代表你已經洞察了大數據與傳統資料處理在思維上的根本差異。這道題目對於區分「精細化統計」與「海量數據洞察」具有很好的鑑別度,許多初學者容易掉入「資料必須絕對精確」的陷阱,但你成功避開了。
大數據的容錯思維與特徵
在大數據的特徵中,雖然我們追求價值,但與傳統小樣本調查要求「絕對精確」不同。由於大數據具備 大量(Volume) 與 多樣(Variety) 的特性,其中必然包含許多非結構化的雜訊,例如社群媒體上的贅字或感測器的偶然誤差。在分析實務上,我們更看重的是從海量資料中挖掘出「趨勢」,而非糾結於每一筆資料的準確性。因此,適度的容錯性是大數據分析中為了換取效率與全貌而必須接受的特質。
▼ 還有更多解析內容