Tugas Programming
Table of Contents
Penggunaan Python dalam Analisis Sentimen - This article is part of a series.
1. Pre-processing Text dengan NLTK #
Buatlah sebuah fungsi Python yang menerima sebuah teks dan melakukan pre-processing menggunakan library NLTK. Langkah-langkah pre-processing yang diharapkan termasuk mengubah teks menjadi lowercase, menghapus karakter non-alfanumerik, dan melakukan stemming.
Contoh Input:
The quick brown fox jumps over the lazy dogs.
Contoh Output:
quick brown fox jump lazy dog
Mudah
2. Analisis Sentimen dengan TextBlob #
Buatlah sebuah fungsi Python yang menerima sebuah teks dan menggunakan TextBlob untuk melakukan analisis sentimen. Fungsi ini harus mengembalikan nilai sentimen (positif, negatif, atau netral) dan tingkat kepercayaan hasil analisis.
Contoh Input:
text = "This movie is great!"
Contoh Output:
Sentimen: Positive, Kepercayaan: 0.75
Mudah
3. Ekstraksi Fitur menggunakan TF-IDF #
Buatlah sebuah program Python yang menggunakan TF-IDF untuk melakukan ekstraksi fitur pada sebuah dataset teks. Program ini harus melibatkan pembagian data menjadi data pelatihan dan pengujian, melakukan pre-processing, dan menghitung vektor TF-IDF untuk teks pada data pelatihan. Terakhir, tampilkan vektor TF-IDF untuk satu teks pada data pengujian.
Output yang Diinginkan:
Contoh vektor TF-IDF untuk satu teks pada data pengujian:
[[0. 0. 0. ... 0. 0. 0.]]
Sedang
4. Pendekatan Rule-Based dengan VADER Sentiment Analysis #
Buatlah sebuah fungsi Python yang menerima daftar teks dan menggunakan pendekatan rule-based dengan VADER Sentiment Analysis untuk menilai sentimen pada setiap teks. Fungsi ini harus mengembalikan daftar prediksi sentimen (1 untuk positif, 0 untuk negatif).
Contoh Input:
texts = ["I love this product!", "The quality is not good."]
Contoh Output:
[1, 0]
Sulit
5. Perbandingan Analisis Sentimen antara TextBlob dan VADER #
Buatlah sebuah program Python yang memuat dataset IMDB Movie Reviews, melakukan pre-processing, dan membandingkan kinerja analisis sentimen antara TextBlob dan VADER Sentiment Analysis pada data pengujian. Tampilkan akurasi dan tingkat kepercayaan (confidence) masing-masing metode.
Contoh Output:
Akurasi TextBlob: 0.85, Confidence: 0.75
Akurasi VADER: 0.82, Confidence: [0.6, 0.8, ...]
Sulit