Memasukan kodingan stemming sastrawi

Saya ingin bertanya, dalam preprossesing text kan ada langkah untuk mengubah kata menjadi kata dasar, saya ingin menambahkan stemming sastrawi. Di phyton kan ada library untuk stemming sastrawi, namun saya belum bisa menempatkannya Penempatannya sebelum kata bersih seperti kodingan dibawah, tolong dong yg bisa terimakasih

# TOKENIZING STOPWORDS# stopwords = stopword # insialisasi bank kata(variabel stopwords) yang isinya sama dengan variabel stopword for x in range(0, 1): # file dokumen yg akan di looping stopwords[x] = stopword[ x].split() # isi dari 'variabel word' di pecah2 menjadi satuan kata lalu di copy ke sebuah variabel indeks ke-x print("\nTokenizing Stopwords: \n", stopwords)

# FILTERING# for x in range(0, 7): for y in range(0, len(bagOfWords[x])): for z in range(0, 743): if (bagOfWords[x][y] == stopwords[0][ z]): # proses membandingkan setiap kata per dokumen dgn setiap kata pada stopword bagOfWords[x][y] = '' # jika ditemukan kata yang tidak penting maka kata tsb dihapus print("\nFiltering: \n", bagOfWords)

#STEMMING SASTRAWI

# KATA BERSIH/Mengembalikan kata2 yg sudah tidak ada kata yg 'tidak penting' menjadi kalimat utuh/dokumen# for i in range(0, len(bagOfWords)): # looping untuk seluruh kata pada bank kata bagOfWords[i] = filter(bool, bagOfWords[i]) # menghapus kata yg kosong dataSet[i] = ' '.join(bagOfWords[i]) # menggabungkan kata demi kata dengan sebuah pemisah spasi per dokumen print("\nKata Bersih: \n", dataSet)

avatar Reirfans
@Reirfans

1 Kontribusi 0 Poin

Diperbarui 5 tahun yang lalu

1 Jawaban:

<pre> from Sastrawi.Stemmer.StemmerFactory import StemmerFactory

def stemming_preprocessing(text): factory = StemmerFactory() stemmer = factory.create_stemmer() return stemmer.stem(text) </pre>

avatar kikimf
@kikimf

91 Kontribusi 78 Poin

Dipost 5 tahun yang lalu

Tanggapan

Ini sudah saya coba, prosesnya tidak error ketika di run,namun belum ke stem textnya,kira2 kenapa ya? Terima kasih sebelumnya sudah menjawab

Login untuk ikut Jawaban