TF-IDF

分類 自然語言處理

TF-IDF是什麼

TF-IDF為Term Frequency-Inverse Document Frequency的縮寫。

所以TF-IDF用來做什麼

顧名思義,他是用來計算一個詞在一整組文件中所出現的頻率,而計算詞頻可以進一步用來反映對於某份文件而言,哪些關鍵字是比較重要的(這裡的預設是,一個詞越常出現,它在文件中就越重要)。而TF-IDF加強版的算法。但什麼叫加強版?對哪種普通版本的加強?

繼續閱讀
  • 第 1 頁 共 1 頁
作者的圖片

puerdon

學習筆記 / 資源整理 / 雜物堆放


語言學研究