Tugas Programming
136 words·3 mins·
loading
·
loading
·
Table of Contents
Persiapan Data untuk Machine Learning - This article is part of a series.
Part 7: This Article
1. Profil Data Awal #
Identifikasi dan tampilkan jumlah missing values dalam setiap kolom dataset UCI ML Breast Cancer Wisconsin.
Mudah2. Analisis Korelasi #
Hitung dan tampilkan matriks korelasi antar variabel numerik dalam dataset UCI ML Breast Cancer Wisconsin.
Mudah3. Pembagian Dataset #
Bagi dataset UCI ML Breast Cancer Wisconsin menjadi data pelatihan, validasi, dan pengujian dengan proporsi 70%, 10%, dan 20%.
Sedang4. Normalisasi Data #
Terapkan Min-Max Scaling pada satu fitur numerik dalam dataset UCI ML Breast Cancer Wisconsin.
Sedang5. Pengelolaan Data yang Imbalance #
Terapkan metode oversampling (SMOTE) pada dataset yang tidak seimbang.
Contoh Output:
Jumlah Data Pelatihan Sebelum SMOTE: 800
Jumlah Data Pelatihan Setelah SMOTE: 1600
Sulit
6. Analisis Korelasi (Dataset: UCI Breast Cancer) #
Tentukan dua fitur dengan korelasi tertinggi dalam dataset UCI ML Breast Cancer Wisconsin.
SulitPersiapan Data untuk Machine Learning - This article is part of a series.
Part 7: This Article