Pencarian Kata dengan NLTK
Table of Contents
Mini Proyek 1 Pencarian Kata dalam Teks - This article is part of a series.
Setelah kita berhasil mendapatkan input teks dan kata pencarian dari pengguna, langkah selanjutnya adalah melakukan pencarian kata dalam teks tersebut. Dalam pembahasan ini, kita akan mengembangkan konsep pencarian kata dengan menambahkan langkah-langkah lebih lanjut.
a. Tokenisasi Teks #
Sebelum kita melakukan pencarian kata, pertama-tama kita perlu melakukan tokenisasi teks. Tokenisasi adalah proses mengonversi teks menjadi token atau kata-kata individual. Kita dapat menggunakan library NLTK untuk membantu dalam proses ini.
def tokenize_text(teks):
"""
Fungsi untuk melakukan tokenisasi teks menggunakan NLTK.
"""
tokens = nltk.word_tokenize(teks)
return tokens
Instruksi untuk membuat fungsi ini:
- Buat sebuah fungsi dengan nama
tokenize_text
. - Di dalam fungsi, gunakan fungsi
nltk.word_tokenize
untuk melakukan tokenisasi teks. - Kembalikan daftar token yang dihasilkan.
b. Pencarian Kata dalam Teks #
Setelah melakukan tokenisasi, kita dapat memeriksa apakah kata pencarian ada dalam daftar token tersebut. Kita juga dapat mempertimbangkan pengabaian huruf besar/kecil (case-insensitive) agar pencarian lebih fleksibel.
def search_word_in_text(tokens, kata_pencarian):
"""
Fungsi untuk mencari kata dalam teks berdasarkan token.
"""
if kata_pencarian.lower() in map(str.lower, tokens):
print(f"Kata '{kata_pencarian}' ditemukan dalam teks.")
else:
print(f"Kata '{kata_pencarian}' tidak ditemukan dalam teks.")
Instruksi untuk membuat fungsi ini:
- Buat sebuah fungsi dengan nama
search_word_in_text
. - Di dalam fungsi, gunakan validasi untuk memeriksa apakah kata pencarian ada dalam daftar token.
- Gunakan
map(str.lower, tokens)
untuk membuat pencarian menjadi case-insensitive. - Tampilkan hasil pencarian kepada pengguna.
c. Menjalankan Fungsi Pencarian #
Langkah terakhir adalah menjalankan kedua fungsi yang telah dibuat di atas menggunakan input dari pengguna.
if __name__ == "__main__":
# Mendapatkan input teks dari pengguna
teks = get_user_text()
# Mendapatkan input kata pencarian dari pengguna
kata_pencarian = get_search_word()
# Tokenisasi teks
tokens = tokenize_text(teks)
# Pencarian kata dalam teks
search_word_in_text(tokens, kata_pencarian)
Untuk menjalankan aplikasi, gunakan perintah berikut:
python pencarian_kata.py
Berikut adalah contoh hasil print setelah menjalankan aplikasi:
Copy code
Masukkan teks atau kalimat: Coding adalah salah satu langkah-langkah pemrograman.
Input teks yang dimasukkan:
Coding adalah salah satu langkah-langkah pemrograman.
Masukkan kata yang ingin kamu cari: langkah
Input kata pencarian:
langkah
Kata 'langkah' ditemukan dalam teks.
Silakan mencoba dengan teks dan kata pencarian yang berbeda untuk menguji fungsionalitas aplikasi.
Dengan langkah-langkah ini, kita telah mengembangkan proses pencarian kata dalam teks. Proses ini mencakup tokenisasi teks menggunakan NLTK dan pencarian kata dalam daftar token tersebut. Selain itu, kita mempertimbangkan fleksibilitas pencarian dengan mengabaikan huruf besar/kecil. Silakan dicoba dengan teks dan kata pencarian yang berbeda untuk menguji fungsionalitas aplikasi.