• AI 是什麼?
    • Deep Learning
    • Machine Learning
    • Reinforcement Learning
  • Android
    • Android 開機流程
    • OTA 升級
    • Partition
  • 筆記雜學
    • Notion 你的第二大腦
    • Life Operating System
    • 人生資料庫
  • 旅行足跡
    • 日本交換
    • 單車環島
    • 新竹一日遊s
  • 生活隨筆
    • 日更30 – 小金魚的人生實驗室
    • 未來規劃
    • 閱讀分享
Robin Kuo
程式學習|筆記雜學|旅行足跡
AI 是什麼?NLP

RAKE 關鍵字擷取演算法

by Robin Kuo 2021-04-20

RAKE 全名是 Rapid Automatic Keyword Extraction,是個用於判斷句子中「關鍵字」的演算法
而 RAKE 的特點在於快速,不需要過多複雜的運算,一個簡單規則就可以抓出文中重點
這個方法鼓勵找出句子中的複合詞(compound word)

RAKE 的運作原理基於斷詞(把句子中無意義的字遮掉)作為文字分段的依據,例如:

RAKE is a text rank algorithm to find important text.

經過斷詞後變成:

Rake – text rank algorithm – important text.

把斷詞斷在一起的單字相連,得到 RAKE、text rank algorithm、important text 這三組複合詞
建立一個表個來區分各個單字出現頻率的關聯表:

RAKEtextrankalgorithmimportant
RAKE1
text2111
rank111
algorithm111
important11
單字關聯表

基於上面單字的關聯表計算每個字的關連性(degree)與頻率(frequency)

  • frequency — 單字出現的次數,依單字關聯表可以發現,除了 text 出現 2次以外其他單字都是 1
  • degree — 單字的關聯性,例如 important text 這兩個單字互相關聯 degree 為 2,而 text rank algorithm 三個單字互相關聯 degree 為 3,其中 text 這個單字在兩個複合詞中都有出現,所以 degree 相加為 5
textrankalgorithmimportant
degree3+2332
frequence1+1111
degree / frequency2.5332

回推這三組文字的的分數得:

  • RAKE = 1
  • text rank algorithm = 2.5 + 3 + 3 = 8.5
  • important text = 2.5 + 2 = 4.5

這樣算起來 text rank algorithm 就是這個句子的關鍵字了!

論文來源:https://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.657.8134&rep=rep1&type=pdf

0 comment
0
FacebookTwitterPinterestEmail
next post
單車環島D0 一天內準備單車環島行李

You may also like

【腦海中的那張圖...

2024-01-03

【Pika 是否...

2023-12-22

【日更30達成!...

2023-12-09

【新書閱讀: 順...

2023-12-04

【可以用講的做影...

2023-11-29

【績效隨便填,考...

2023-11-17

從資浅邁向資深的...

2023-10-05

【泄露機密後反成...

2023-07-20

有必要訓練台灣自...

2023-06-10

Leave a Comment Cancel Reply

Save my name, email, and website in this browser for the next time I comment.

關於 Robin Kuo

▍分享關於:閱讀、AI、筆記、生活中的小趣事
尋覓生活價值的逐夢者
雖然目前是個載浮載沉的一般上班族…
▍莫忘初衷,紀錄生活、分享為樂

近期文章

  • 【腦海中的那張圖片🖼️】

    2024-01-03
  • 技術範本專案: OSH 框架

    2023-12-31
  • 【網路其實不只是網頁? Ted Nelson在網路上的超文本】

    2023-12-28
  • 【Pika 是否能讓啾吉動起來?】

    2023-12-22
  • 【日更30達成!】#Day30

    2023-12-09

分類

  • AI 是什麼?
  • Android
  • Deep Learning
  • NLP
  • Notion 你的第二大腦
  • OTA 升級
  • 單車環島
  • 旅行足跡
  • 日更30 – 小金魚的人生實驗室
  • 未來規劃
  • 生活隨筆
  • 筆記雜學
  • 閱讀分享
Robin Kuo
  • AI 是什麼?
    • Deep Learning
    • Machine Learning
    • Reinforcement Learning
  • Android
    • Android 開機流程
    • OTA 升級
    • Partition
  • 筆記雜學
    • Notion 你的第二大腦
    • Life Operating System
    • 人生資料庫
  • 旅行足跡
    • 日本交換
    • 單車環島
    • 新竹一日遊s
  • 生活隨筆
    • 日更30 – 小金魚的人生實驗室
    • 未來規劃
    • 閱讀分享