Skip to main content
  1. Belajar/
  2. Machine Learning with Python/
  3. 2. Persiapan Data untuk Machine Learning/

Tugas Programming

3 mins· loading · loading ·
Persiapan Data untuk Machine Learning - This article is part of a series.
Part 7: This Article

1. Profil Data Awal
#

Identifikasi dan tampilkan jumlah missing values dalam setiap kolom dataset UCI ML Breast Cancer Wisconsin.

Mudah

2. Analisis Korelasi
#

Hitung dan tampilkan matriks korelasi antar variabel numerik dalam dataset UCI ML Breast Cancer Wisconsin.

Mudah

3. Pembagian Dataset
#

Bagi dataset UCI ML Breast Cancer Wisconsin menjadi data pelatihan, validasi, dan pengujian dengan proporsi 70%, 10%, dan 20%.

Sedang

4. Normalisasi Data
#

Terapkan Min-Max Scaling pada satu fitur numerik dalam dataset UCI ML Breast Cancer Wisconsin.

Sedang

5. Pengelolaan Data yang Imbalance
#

Terapkan metode oversampling (SMOTE) pada dataset yang tidak seimbang.

Contoh Output:

Jumlah Data Pelatihan Sebelum SMOTE: 800
Jumlah Data Pelatihan Setelah SMOTE: 1600
Sulit

6. Analisis Korelasi (Dataset: UCI Breast Cancer)
#

Tentukan dua fitur dengan korelasi tertinggi dalam dataset UCI ML Breast Cancer Wisconsin.

Sulit
Persiapan Data untuk Machine Learning - This article is part of a series.
Part 7: This Article