跳去內容

潛在語義分析

出自維基百科,自由嘅百科全書

潛在語義分析英文latent semantic analysis,LSA)係自然語言處理上成日用嘅一種分析方法。

LSA 步驟大致如下[1]

  • 計個矩陣出嚟-
    • 矩陣每條橫行表示一隻字詞;
    • 矩陣每條直行表示一份文件或者一句句子
    • 矩陣每一格反映嗰隻字詞喺嗰份文件或者句子當中有幾「重要」(睇埋 tf-idf);

跟住段演算法就會(例如)做降維-攞住個矩陣,嘗試搵個新矩陣出嚟,而個新矩陣橫行數量少咗,但同時維持住直行之間嘅相似度分佈,打後得出嗰個(維數少嘅)矩陣就最代表到啲文件嘅意思,最後段演算法就用維數少嗰個矩陣比較啲文件喺意思上嘅相似度。

睇埋

🔥 Top keywords: 頭版Special:搜索玩轉腦朋友慶餘年許鈞國家面積一覽高橋一生田井虹Special:最近修改歌手2024無綫新聞部主要人員名單廣東話粗口亞氏保加症曾紀華家族女皇撞到正徐有潔大明皇帝一覽湯家驊各國兵力一覽唔鹹唔淡香港指南戴恩玲成語疊字數學符號安士飯豐萬理江在絕版前放浪一次千門八將口交香港趙麗穎周殷廷怪宿宿廣東城市一覽惡戰Faouzia陸偉雄英格蘭超級足球聯賽六合彩朱韻韻