Operasi Agregasi
Table of Contents
NumPy Dasar-dasar Komputasi Numerik - This article is part of a series.
Operasi agregasi pada NumPy Array adalah langkah kritis dalam analisis data numerik. Melalui fungsi-fungsi agregasi, kita dapat merangkum dan menganalisis dataset dengan metode statistik yang kuat. Mari kita telaah lebih lanjut tentang berbagai operasi agregasi yang dapat dilakukan dengan NumPy.
A. Fungsi Agregasi Built-in #
1. Menghitung Jumlah dan Rata-rata #
Fungsi np.sum()
dan np.mean()
memungkinkan kita untuk menghitung jumlah dan rata-rata elemen-elemen array.
import numpy as np
arr = np.array([1, 2, 3, 4, 5])
# Menghitung jumlah elemen array
total_sum = np.sum(arr)
# Menghitung rata-rata elemen array
mean_value = np.mean(arr)
Hasil Print:
Jumlah elemen: 15
Rata-rata elemen: 3.0
2. Mencari Nilai Minimum dan Maksimum #
Fungsi np.min()
dan np.max()
digunakan untuk menemukan nilai minimum dan maksimum dalam array.
import numpy as np
arr = np.array([1, 2, 3, 4, 5])
# Mencari nilai minimum dan maksimum
min_value = np.min(arr)
max_value = np.max(arr)
Hasil Print:
Nilai minimum: 1
Nilai maksimum: 5
B. Agregasi pada Axis Tertentu #
1. Agregasi pada Baris dan Kolom #
Ketika kita bekerja dengan array multi-dimensi, kita dapat melakukan agregasi sepanjang sumbu tertentu, baik itu baris atau kolom, menggunakan parameter axis.
import numpy as np
arr_2d = np.array([[1, 2, 3], [4, 5, 6]])
# Agregasi sumbu 0 (baris)
sum_along_rows = np.sum(arr_2d, axis=0)
# Agregasi sumbu 1 (kolom)
sum_along_columns = np.sum(arr_2d, axis=1)
Hasil Print:
Agregasi sumbu 0:
array([5, 7, 9])
Agregasi sumbu 1:
array([6, 15])
C. Fungsi Agregasi Statistik #
1. Standar Deviasi dan Variansi #
Fungsi np.std()
dan np.var()
digunakan untuk menghitung standar deviasi dan variansi dari elemen-elemen array.
import numpy as np
arr = np.array([1, 2, 3, 4, 5])
# Menghitung standar deviasi dan variansi
std_deviation = np.std(arr)
variance = np.var(arr)
Hasil Print:
Standar deviasi: 1.4142135623730951
Variansi: 2.0
2. Korelasi dan Kovariansi #
NumPy menyediakan fungsi np.corrcoef()
dan np.cov()
untuk menghitung matriks korelasi dan kovariansi antar variabel dalam array.
import numpy as np
arr1 = np.array([1, 2, 3, 4, 5])
arr2 = np.array([5, 4, 3, 2, 1])
# Menghitung korelasi dan kovariansi
correlation_matrix = np.corrcoef(arr1, arr2)
covariance_matrix = np.cov(arr1, arr2)
Hasil Print:
Matriks Korelasi:
array([[ 1., -1.],
[-1., 1.]])
Matriks Kovariansi:
array([[ 2.5, -2.5],
[-2.5, 2.5]])