Skip to main content
  1. Belajar/
  2. Data Science with Python/
  3. Pandas - Proses Data Time Series/

Persiapan Lingkungan Pengembangan

6 mins· loading · loading ·
Pandas - Proses Data Time Series - This article is part of a series.

A. Instalasi Library
#

Sebelum memulai analisis data time series, pastikan untuk menginstal library yang diperlukan. Dalam hal ini, kita akan menggunakan Pandas dan Matplotlib. Jalankan perintah berikut untuk menginstalnya:

pip install pandas matplotlib

B. Mempersiapkan Dataset
#

Untuk analisis data time series, kita akan menggunakan dataset contoh yang dapat diunduh dari data_penjualan.csv. Dataset ini merupakan dataset penjualan selama 2 tahun yaitu mulai Januari 2022 sampai Desember 2023. Dataset ini terdiri dari kolom Tanggal, Kategori, dan Jumlah. Kategori dapat berupa “Elektronik”, “Pakaian”, atau “Buku”.

Berikut adalah cara mendownload dan menampilkan dataset menggunakan Pandas:

import pandas as pd
import requests
from io import StringIO

# URL dataset
url = 'https://rumahcoding.id/data_penjualan.csv'

# Menambahkan header pada permintaan HTTP
headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/91.0.4472.124 Safari/537.36'
}

# Melakukan permintaan HTTP dengan header
response = requests.get(url, headers=headers)

# Membaca data CSV dari respons HTTP
sales_data = pd.read_csv(StringIO(response.text))

Pada kode di atas, kita menggunakan fungsi pd.read_csv() untuk membaca dataset dari URL yang diberikan. Setelah itu, kita menampilkan 5 data pertama dari dataset penjualan. Pastikan komputer Anda terhubung ke internet untuk dapat mengunduh dataset dari URL tersebut.

Untuk mengatasi masalah HTTP Error 403: Forbidden, kita menambahkan header pada permintaan HTTP untuk menunjukkan bahwa kita adalah pengguna yang sah. Pada kode di atas, kita menambahkan header menggunakan parameter headers pada permintaan HTTP. Header yang ditambahkan mencakup informasi pengguna agen pengguna (User-Agent) seperti yang digunakan oleh browser Chrome. Selanjutnya, kita menggunakan StringIO untuk membaca data CSV dari respons HTTP.

Pandas - Proses Data Time Series - This article is part of a series.