Postingan lainnya
Memasukan kodingan stemming sastrawi
Saya ingin bertanya, dalam preprossesing text kan ada langkah untuk mengubah kata menjadi kata dasar, saya ingin menambahkan stemming sastrawi. Di phyton kan ada library untuk stemming sastrawi, namun saya belum bisa menempatkannya Penempatannya sebelum kata bersih seperti kodingan dibawah, tolong dong yg bisa terimakasih
# TOKENIZING STOPWORDS# stopwords = stopword # insialisasi bank kata(variabel stopwords) yang isinya sama dengan variabel stopword for x in range(0, 1): # file dokumen yg akan di looping stopwords[x] = stopword[ x].split() # isi dari 'variabel word' di pecah2 menjadi satuan kata lalu di copy ke sebuah variabel indeks ke-x print("\nTokenizing Stopwords: \n", stopwords)
# FILTERING# for x in range(0, 7): for y in range(0, len(bagOfWords[x])): for z in range(0, 743): if (bagOfWords[x][y] == stopwords[0][ z]): # proses membandingkan setiap kata per dokumen dgn setiap kata pada stopword bagOfWords[x][y] = '' # jika ditemukan kata yang tidak penting maka kata tsb dihapus print("\nFiltering: \n", bagOfWords)
#STEMMING SASTRAWI
# KATA BERSIH/Mengembalikan kata2 yg sudah tidak ada kata yg 'tidak penting' menjadi kalimat utuh/dokumen# for i in range(0, len(bagOfWords)): # looping untuk seluruh kata pada bank kata bagOfWords[i] = filter(bool, bagOfWords[i]) # menghapus kata yg kosong dataSet[i] = ' '.join(bagOfWords[i]) # menggabungkan kata demi kata dengan sebuah pemisah spasi per dokumen print("\nKata Bersih: \n", dataSet)
1 Jawaban:
<pre> from Sastrawi.Stemmer.StemmerFactory import StemmerFactory
def stemming_preprocessing(text): factory = StemmerFactory() stemmer = factory.create_stemmer() return stemmer.stem(text) </pre>
Tanggapan
Ini sudah saya coba, prosesnya tidak error ketika di run,namun belum ke stem textnya,kira2 kenapa ya? Terima kasih sebelumnya sudah menjawab