Feature Extraction dalam NLP

Mengubah teks menjadi representasi numerik

Lanjut Belajar

Feature Extraction: Dari Teks ke Angka

Setelah preprocessing, kita perlu mengubah teks bersih menjadi angka. Proses ini disebut feature extraction atau ekstraksi fitur.

Mengapa perlu diubah menjadi angka? Karena algoritma machine learning hanya bisa memproses data numerik, bukan teks langsung.

Feature Extraction Transformasi teks ke vektor
Bag of Words Menghitung frekuensi kemunculan kata
TF-IDF Memberikan bobot berdasarkan kepentingan
N-grams Mempertimbangkan urutan kata
Naive Bayes Klasifikasi menggunakan fitur

Metode yang akan kita pelajari:

  • Bag of Words (BoW) - Menghitung frekuensi kata
  • TF-IDF - Memberikan bobot berdasarkan kepentingan
  • N-grams - Mempertimbangkan urutan kata