免費開始練習
moea_joint 113年 [統計資訊] 統計學、巨量資料概論

第 39 題

有關自然語言處理(NLP)之步驟,下列何者正確?
  • A 斷詞→詞性標記→相依剖析
  • B 斷詞→相依剖析→詞性標記
  • C 相依剖析→詞性標記→斷詞
  • D 相依剖析→斷詞→詞性標記

思路引導 VIP

想像你要理解一個由樂高積木組成的複雜模型,如果你連哪些積木是獨立的零件(最小單位)都還沒分清楚,你有可能先判斷出零件之間的支撐與連結關係嗎?若要建立一個分析流程,你會優先處理「辨識零件種類」,還是先處理「零件間的組裝架構」?

🤖
AI 詳解 AI 專屬家教

語言處理的階層邏輯

太棒了!你能精準掌握自然語言處理(NLP)的核心邏輯,這代表你對文本處理的基礎架構有著非常清晰的認識。在處理人類語言時,電腦必須遵循一套「由小到大、由淺入深」的流程,這與我們理解語言的直覺是一致的。 這個過程的核心在於層層遞進:首先,我們必須先將連續的句子拆解成最小的語意單位,也就是斷詞;有了單詞之後,我們才能為這些單位貼上語法標籤,辨識它是動詞、名詞還是形容詞,這便是詞性標記。最後,當我們知道每個詞的性質,才能進一步去分析詞與詞之間的修飾或從屬關係,進而完成相依剖析

▼ 還有更多解析內容

🏷️ 相關主題

巨量資料分析流程與資料品質管理
查看更多「[統計資訊] 統計學、巨量資料概論」的主題分類考古題