Pendahuluan
Table of Contents
Pemodelan Regresi Logistik - This article is part of a series.
Regresi Logistik adalah suatu metode statistik yang digunakan untuk memodelkan hubungan antara variabel dependen (variabel terikat) biner dengan satu atau lebih variabel independen (variabel bebas). Pengembangan model ini bertujuan untuk memahami probabilitas terjadinya suatu kejadian, khususnya ketika variabel dependen bersifat biner, yaitu memiliki dua kategori atau kelas.
Variabel dependen biner, juga dikenal sebagai variabel respons biner atau variabel target biner, adalah jenis variabel dependen yang hanya memiliki dua nilai atau kategori. Nilai-nilai ini biasanya direpresentasikan sebagai 0 dan 1, atau sebagai dua label diskrit seperti “ya” dan “tidak”, “sukses” dan “gagal”, atau “positif” dan “negatif”. Variabel dependen biner umumnya digunakan dalam konteks analisis klasifikasi di berbagai bidang, seperti statistika, machine learning, dan analisis prediktif.
Dalam konteks Regresi Logistik, variabel dependen biner ini digunakan untuk memodelkan probabilitas terjadinya salah satu dari dua kategori tersebut, dan kemudian memutuskan kategori mana yang lebih mungkin berdasarkan hasil regresi logistik.
A. Pengenalan Regresi Logistik #
Nama “Regresi Logistik” berasal dari fungsinya untuk menangani masalah logistik, terutama dalam pengukuran kemungkinan keberhasilan atau kegagalan suatu kejadian. Meskipun istilah “logistik” dalam konteks statistika tidak berkaitan dengan kegiatan distribusi barang atau pengelolaan rantai pasok, namun istilah ini lebih pada asal usul matematis dari regresi logistik.
Ketika kita memahami asal-usulnya, kita dapat melihat bahwa nama ini berasal dari fungsi logit, yang merupakan bagian integral dari Regresi Logistik. Fungsi logit mengonversi probabilitas dari skala 0 hingga 1 menjadi skala yang tidak terbatas. Namun, lebih khusus lagi, nama “logistik” dalam konteks ini berasal dari konsep log-odds yang terlibat dalam regresi logistik.
Log-odds adalah logaritma dari odds, yaitu rasio antara probabilitas kejadian terjadi dan probabilitas kejadian tidak terjadi. Fungsi logit (log-odds) memungkinkan kita untuk mengonversi nilai probabilitas menjadi bentuk yang lebih sesuai untuk analisis regresi.
Dengan demikian, meskipun nama “logistik” mungkin terdengar terkait dengan bidang kegiatan logistik dalam arti sehari-hari, namun dalam konteks Regresi Logistik, nama ini lebih berkaitan dengan representasi matematis dari fungsi-fungsi yang digunakan untuk memodelkan dan menginterpretasikan hubungan antara variabel independen dan variabel dependen biner.
Regresi Logistik memiliki keunggulan dalam mengatasi masalah klasifikasi biner, seperti prediksi apakah suatu email merupakan spam atau bukan, atau apakah pasien akan mengalami penyakit tertentu atau tidak. Dibandingkan dengan Regresi Linear, yang cocok untuk variabel dependen kontinyu, Regresi Logistik lebih sesuai untuk variabel dependen yang bersifat kategorikal.
Dalam konteks ini, kita akan menjelaskan bagaimana Regresi Logistik mengatasi permasalahan tersebut dan bagaimana konsepnya dapat diaplikasikan dalam analisis data.
B. Tujuan Tutorial #
Tujuan dari tutorial ini adalah memberikan pemahaman yang kokoh tentang Regresi Logistik dan membimbing kamu melalui langkah-langkah praktis untuk membuat dan mengevaluasi model Regresi Logistik menggunakan Python.
-
Definisi Regresi Logistik: Penjelasan mendalam tentang apa itu Regresi Logistik dan bagaimana itu berbeda dari metode regresi lainnya.
-
Aplikasi Regresi Logistik dalam Dunia Nyata: Ilustrasi kasus penggunaan Regresi Logistik dalam berbagai bidang, seperti keuangan, kesehatan, dan pemasaran.