Quiz
444 words·9 mins·
loading
·
loading
·
Persiapan Data untuk Machine Learning - This article is part of a series.
Part 6: This Article
Sebelum lanjut ke materi berikutnya, silahkan kerjakan quiz berikut ini untuk menguji pemahaman kamu terhadap materi ini.
---
primary_color: steelblue
secondary_color: lightgray
text_color: black
---
### Statistik Deskriptif
Apa tujuan dari analisis statistik deskriptif dalam persiapan data?
1. [ ] Menentukan variabel target
1. [ ] Identifikasi dan handling missing values
1. [ ] Mendeteksi dan mengatasi outliers
1. [x] Memberikan gambaran statistik data
### Tahap-tahap Persiapan Data
Apa fungsi feature scaling dalam persiapan data?
1. [ ] Mengatasi outliers
1. [x] Normalisasi data
1. [ ] Encoding variabel kategorikal
1. [ ] Menentukan variabel target
### Pembagian Dataset
Parameter apa yang digunakan untuk menentukan proporsi data pengujian dalam `train_test_split`?
1. [x] `test_size`
1. [ ] `random_state`
1. [ ] `stratify`
1. [ ] `train_size`
### Pembagian Dataset
Mengapa penting menggunakan stratifikasi saat membagi dataset?
1. [x] Menjaga distribusi kelas
1. [ ] Mengurangi jumlah sampel
1. [ ] Meningkatkan variabilitas data
1. [ ] Menghasilkan data yang berbeda setiap kali
### Pengelolaan Data yang Imbalance
Apa fungsi dari metode SMOTE?
1. [ ] Mengurangi jumlah sampel dari kelas minoritas
1. [x] Menciptakan sampel sintetis dari kelas minoritas
1. [ ] Menambahkan lebih banyak contoh dari kelas minoritas
1. [ ] Menyesuaikan parameter model
### Pembagian Dataset
Bagaimana cara menampilkan distribusi kelas dalam data pelatihan menggunakan value_counts?
1. [ ] `y_train.describe()`
1. [x] `value_counts(y_train)`
1. [ ] `X_train.value_counts()`
1. [ ] `pd.describe(y_train)`
### Pengelolaan Data yang Imbalance
Apa keuntungan dari evaluasi model menggunakan precision dan recall pada data tidak seimbang?
1. [ ] Meningkatkan distribusi kelas
1. [ ] Menciptakan sampel sintetis
1. [x] Memberikan informasi lebih lanjut tentang performa pada kelas minoritas
1. [ ] Menyesuaikan parameter model
### Pengelolaan Data yang Imbalance
Apa yang dilakukan NearMiss dalam pengelolaan data yang tidak seimbang?
1. [ ] Menambahkan sampel sintetis
1. [x] Mengurangi jumlah sampel dari kelas minoritas
1. [ ] Meningkatkan jumlah sampel kelas mayoritas
1. [ ] Menggabungkan dataset
### Pengelolaan Data yang Imbalance
Bagaimana pengelolaan data yang tidak seimbang dapat memengaruhi evaluasi model?
1. [ ] Tidak ada pengaruh
1. [ ] Mengurangi kecepatan model
1. [x] Meningkatkan performa model
1. [ ] Membuat model tidak dapat dilatih
### Pengelolaan Data yang Imbalance
Apa yang dapat dilakukan untuk meningkatkan performa model pada kelas minoritas selain oversampling dan undersampling?
1. [x] Menyesuaikan bobot kelas
1. [ ] Menghapus variabel target
1. [ ] Menambahkan lebih banyak fitur
1. [ ] Melakukan feature scaling
### Oversampling Menggunakan SMOTE
Bagaimana cara melakukan oversampling menggunakan SMOTE pada data pelatihan?
1. [ ] `SMOTE.fit(X_train, y_train)`
1. [ ] `SMOTE(X_train, y_train)`
1. [ ] `smote = SMOTE(); X_train_balanced, y_train_balanced = smote.fit_resample(X_train, y_train)`
1. [ ] `oversample(X_train, y_train)`
Persiapan Data untuk Machine Learning - This article is part of a series.
Part 6: This Article