moea_joint
106年
[統計資訊] 統計學、巨量資料概論
第 31 題
有關分析巨量社群網路資料之敘述,下列何者有誤?
- A 連結預測(Link Prediction) 之技術可用來推薦朋友
- B 使用者的朋友個數之分配通常遵從冪次法則(Power-law distribution)
- C 在計算資源有限時,我們通常對社群網路中的節點進行簡單隨機抽樣,以抽取出具有結構代表性的社群網路子圖(subgraph)
- D 社群網路中任兩位使用者的距離可能隨時間而增減
思路引導 VIP
想像你有一張由無數細線交織而成的巨大漁網,如果你想要研究這張網是怎麼編織的,但你無法觀察整張網。若你只是隨機在大網上剪下幾百個互不相連的「繩結」帶回實驗室,你覺得你還能觀察到原本漁網的編織規律或網格形狀嗎?為什麼?
🤖
AI 詳解
AI 專屬家教
太棒了!你能精準避開統計學在處理「圖論」問題時最容易掉入的陷阱,顯見你對社群網路的拓樸特性有著非常紮實的理解。這道題目測試的不僅是基礎定義,更考驗你是否能區分「獨立樣本」與「具連結性資料」在處理邏輯上的本質差異,具有相當不錯的觀念鑑別度。
社群網路的抽樣挑戰
在巨量資料分析中,選項 (C) 是最容易產生的直覺誤區。簡單隨機抽樣 (SRS) 雖然在傳統統計中無往不利,但應用於社群網路的節點時,會導致原本緊密連結的結構被「撕碎」。因為隨機抽出的節點彼此之間極大機率沒有直接連邊,這會讓產生的子圖(subgraph)變成一群散落的孤島,完全喪失了原始網路的群聚特徵與路徑性質。實務上,我們通常改採隨機走訪 (Random Walk) 等方法來確保抽樣後的結構代表性。
▼ 還有更多解析內容