Skip to main content
Tugas Programming
  1. Belajar/
  2. Machine Learning/
  3. Persiapan Data untuk Machine Learning/

Tugas Programming

136 words·3 mins· loading · loading ·
Rumah Coding
Author
Rumah Coding
Tempatnya belajar coding
Table of Contents
Persiapan Data untuk Machine Learning - This article is part of a series.
Part 7: This Article

1. Profil Data Awal
#

Identifikasi dan tampilkan jumlah missing values dalam setiap kolom dataset UCI ML Breast Cancer Wisconsin.

Mudah

2. Analisis Korelasi
#

Hitung dan tampilkan matriks korelasi antar variabel numerik dalam dataset UCI ML Breast Cancer Wisconsin.

Mudah

3. Pembagian Dataset
#

Bagi dataset UCI ML Breast Cancer Wisconsin menjadi data pelatihan, validasi, dan pengujian dengan proporsi 70%, 10%, dan 20%.

Sedang

4. Normalisasi Data
#

Terapkan Min-Max Scaling pada satu fitur numerik dalam dataset UCI ML Breast Cancer Wisconsin.

Sedang

5. Pengelolaan Data yang Imbalance
#

Terapkan metode oversampling (SMOTE) pada dataset yang tidak seimbang.

Contoh Output:

Jumlah Data Pelatihan Sebelum SMOTE: 800
Jumlah Data Pelatihan Setelah SMOTE: 1600
Sulit

6. Analisis Korelasi (Dataset: UCI Breast Cancer)
#

Tentukan dua fitur dengan korelasi tertinggi dalam dataset UCI ML Breast Cancer Wisconsin.

Sulit
Persiapan Data untuk Machine Learning - This article is part of a series.
Part 7: This Article

comments powered by Disqus