Skip to main content
  1. Belajar/
  2. Python Fundamental/
  3. 12. Mini Proyek 1: Pencarian Kata dalam Teks/

Pencarian Kata dengan NLTK

6 mins· loading · loading ·
Mini Proyek 1 Pencarian Kata dalam Teks - This article is part of a series.
Part 4: This Article

Setelah kita berhasil mendapatkan input teks dan kata pencarian dari pengguna, langkah selanjutnya adalah melakukan pencarian kata dalam teks tersebut. Dalam pembahasan ini, kita akan mengembangkan konsep pencarian kata dengan menambahkan langkah-langkah lebih lanjut.

a. Tokenisasi Teks
#

Sebelum kita melakukan pencarian kata, pertama-tama kita perlu melakukan tokenisasi teks. Tokenisasi adalah proses mengonversi teks menjadi token atau kata-kata individual. Kita dapat menggunakan library NLTK untuk membantu dalam proses ini.

def tokenize_text(teks):
    """
    Fungsi untuk melakukan tokenisasi teks menggunakan NLTK.
    """
    tokens = nltk.word_tokenize(teks)
    return tokens

Instruksi untuk membuat fungsi ini:

  1. Buat sebuah fungsi dengan nama tokenize_text.
  2. Di dalam fungsi, gunakan fungsi nltk.word_tokenize untuk melakukan tokenisasi teks.
  3. Kembalikan daftar token yang dihasilkan.

b. Pencarian Kata dalam Teks
#

Setelah melakukan tokenisasi, kita dapat memeriksa apakah kata pencarian ada dalam daftar token tersebut. Kita juga dapat mempertimbangkan pengabaian huruf besar/kecil (case-insensitive) agar pencarian lebih fleksibel.

def search_word_in_text(tokens, kata_pencarian):
    """
    Fungsi untuk mencari kata dalam teks berdasarkan token.
    """
    if kata_pencarian.lower() in map(str.lower, tokens):
        print(f"Kata '{kata_pencarian}' ditemukan dalam teks.")
    else:
        print(f"Kata '{kata_pencarian}' tidak ditemukan dalam teks.")

Instruksi untuk membuat fungsi ini:

  1. Buat sebuah fungsi dengan nama search_word_in_text.
  2. Di dalam fungsi, gunakan validasi untuk memeriksa apakah kata pencarian ada dalam daftar token.
  3. Gunakan map(str.lower, tokens) untuk membuat pencarian menjadi case-insensitive.
  4. Tampilkan hasil pencarian kepada pengguna.

c. Menjalankan Fungsi Pencarian
#

Langkah terakhir adalah menjalankan kedua fungsi yang telah dibuat di atas menggunakan input dari pengguna.

if __name__ == "__main__":
    # Mendapatkan input teks dari pengguna
    teks = get_user_text()

    # Mendapatkan input kata pencarian dari pengguna
    kata_pencarian = get_search_word()

    # Tokenisasi teks
    tokens = tokenize_text(teks)

    # Pencarian kata dalam teks
    search_word_in_text(tokens, kata_pencarian)

Untuk menjalankan aplikasi, gunakan perintah berikut:

python pencarian_kata.py

Berikut adalah contoh hasil print setelah menjalankan aplikasi:

Copy code
Masukkan teks atau kalimat: Coding adalah salah satu langkah-langkah pemrograman.

Input teks yang dimasukkan:
Coding adalah salah satu langkah-langkah pemrograman.

Masukkan kata yang ingin kamu cari: langkah

Input kata pencarian:
langkah

Kata 'langkah' ditemukan dalam teks.

Silakan mencoba dengan teks dan kata pencarian yang berbeda untuk menguji fungsionalitas aplikasi.

Dengan langkah-langkah ini, kita telah mengembangkan proses pencarian kata dalam teks. Proses ini mencakup tokenisasi teks menggunakan NLTK dan pencarian kata dalam daftar token tersebut. Selain itu, kita mempertimbangkan fleksibilitas pencarian dengan mengabaikan huruf besar/kecil. Silakan dicoba dengan teks dan kata pencarian yang berbeda untuk menguji fungsionalitas aplikasi.

Mini Proyek 1 Pencarian Kata dalam Teks - This article is part of a series.
Part 4: This Article