Traffine I/O

Bahasa Indonesia

2022-03-25

Variansi dan Deviasi Standar

Pengantar

Dalam statistik, konsep deviasi mean, variansi, dan deviasi standar adalah ukuran penting untuk menjelaskan seberapa tersebar data dalam sebuah set data. Ukuran-ukuran tersebut membantu kita memahami seberapa jauh titik data dari nilai mean, memberikan wawasan tentang penyimpangan dan variabilitas data. Dalam artikel ini, saya akan membahas definisi, contoh, dan rumus untuk ukuran-ukuran tersebut, serta cara menghitungnya menggunakan Python.

Deviasi Mean

Deviasi mean, juga dikenal sebagai deviasi mean absolut, adalah mean dari selisih absolut antara setiap titik data dan nilai mean dari set data. Deviasi mean diberikan oleh rumus:

MD = \frac{1}{n} \sum_{i=1}^n |x_i - \bar{x}|

di mana n adalah jumlah titik data, x_i mewakili setiap titik data, dan \bar{x} adalah nilai mean dari set data.

Contoh

Misalkan set data: {4, 6, 8, 10}

mean, \bar{x} = \frac{4+6+8+10}{4} = 7

Deviasi mean, MD = \frac{|4-7| + |6-7| + |8-7| + |10-7|}{4} = \frac{3+1+1+3}{4} = 2

Variansi

Variansi adalah mean dari selisih kuadrat antara setiap titik data dan nilai mean dari set data. Variansi diberikan oleh rumus:

\sigma^2 = \frac{1}{n} \sum_{i=1}^n (x_i - \bar{x})^2

di mana n adalah jumlah titik data, x_i mewakili setiap titik data, dan \bar{x} adalah nilai mean dari set data.

Contoh

Menggunakan set data yang sama sebelumnya: {4, 6, 8, 10}

Variansi, \sigma^2 = \frac{(4-7)^2 + (6-7)^2 + (8-7)^2 + (10-7)^2}{4} = \frac{9+1+1+9}{4} = 5

Deviasi Standar

Deviasi standar adalah akar kuadrat dari variansi, dan merupakan ukuran penyebaran atau keragaman titik data dalam sebuah set data. Deviasi standar diberikan oleh rumus:

\sigma = \sqrt{\frac{1}{n} \sum_{i=1}^n (x_i - \bar{x})^2}

Contoh

Menggunakan set data yang sama sebelumnya: {4, 6, 8, 10}

Deviasi standar, \sigma = \sqrt{5} \approx 2.24

Hubungan Antara Variansi dan Deviasi Standar

Variansi dan deviasi standar adalah ukuran statistik yang saling terkait dan digunakan untuk menjelaskan penyebaran atau dispersi sebuah set data. Kedua ukuran tersebut mengukur sejauh mana titik data individual menyimpang dari nilai mean dari set data. Sementara variansi adalah mean dari selisih kuadrat antara titik data dan nilai mean, deviasi standar adalah akar kuadrat dari variansi.

Hubungan antara variansi dan deviasi standar dapat diungkapkan secara matematis sebagai:

\sigma = \sqrt{\sigma^2}

di mana \sigma mewakili deviasi standar dan \sigma^2 mewakili variansi.

Hubungan ini menyiratkan bahwa deviasi standar selalu memiliki nilai positif, karena merupakan akar kuadrat dari nilai positif (variansi). Selain itu, baik variansi maupun deviasi standar memiliki unit yang sama dengan titik data saat dikuadratkan dan diakarkan, secara berturut-turut. Hal ini berarti bahwa deviasi standar memiliki unit yang sama dengan data asli, sehingga lebih mudah diinterpretasikan dalam konteks set data.

Menghitung Variansi dan Deviasi Standar dengan Python

Untuk menghitung variansi dan deviasi standar menggunakan Python, Anda dapat menggunakan kode berikut:

python
import numpy as np

data = np.array([4, 6, 8, 10])

# Calculate variance
variance = np.var(data)

# Calculate standard deviation
std_dev = np.std(data)

print("Variance:", variance)
print("Standard Deviation:", std_dev)

Menjalankan kode ini akan menghasilkan output berikut:

Variance: 5.0
Standard Deviation: 2.23606797749979

Ryusei Kakujo

researchgatelinkedingithub

Focusing on data science for mobility

Bench Press 100kg!