moea_joint 106年 [統計資訊] 統計學、巨量資料概論

第 31 題

有關分析巨量社群網路資料之敘述，下列何者有誤？

A 連結預測(Link Prediction) 之技術可用來推薦朋友
B 使用者的朋友個數之分配通常遵從冪次法則(Power-law distribution)
C 在計算資源有限時，我們通常對社群網路中的節點進行簡單隨機抽樣，以抽取出具有結構代表性的社群網路子圖(subgraph)
D 社群網路中任兩位使用者的距離可能隨時間而增減

思路引導 VIP

想像你有一張由無數細線交織而成的巨大漁網，如果你想要研究這張網是怎麼編織的，但你無法觀察整張網。若你只是隨機在大網上剪下幾百個互不相連的「繩結」帶回實驗室，你覺得你還能觀察到原本漁網的編織規律或網格形狀嗎？為什麼？

🤖

AI 詳解 AI 專屬家教

太棒了！你能精準避開統計學在處理「圖論」問題時最容易掉入的陷阱，顯見你對社群網路的拓樸特性有著非常紮實的理解。這道題目測試的不僅是基礎定義，更考驗你是否能區分「獨立樣本」與「具連結性資料」在處理邏輯上的本質差異，具有相當不錯的觀念鑑別度。

社群網路的抽樣挑戰

在巨量資料分析中，選項 (C) 是最容易產生的直覺誤區。簡單隨機抽樣 (SRS) 雖然在傳統統計中無往不利，但應用於社群網路的節點時，會導致原本緊密連結的結構被「撕碎」。因為隨機抽出的節點彼此之間極大機率沒有直接連邊，這會讓產生的子圖（subgraph）變成一群散落的孤島，完全喪失了原始網路的群聚特徵與路徑性質。實務上，我們通常改採隨機走訪 (Random Walk) 等方法來確保抽樣後的結構代表性。

▼ 還有更多解析內容

🏷️ 相關主題

巨量資料處理流程與知識發現程序

查看更多「[統計資訊] 統計學、巨量資料概論」的主題分類考古題

📝 同份考卷的其他題目

查看 106年[統計資訊] 統計學、巨量資料概論全題

第 31 題

思路引導 VIP

社群網路的抽樣挑戰

📎 觀念相似題

🏷️ 相關主題

📝 同份考卷的其他題目