Buat Akun DQLab & Akses Kelas Data Science Python, R, SQL, Excel GRATIS!

Kenali Distribusi Normal, Salah Satu Statistika Parametrik

Belajar Data Science di Rumah 07-Januari-2022
https://dqlab.id/files/dqlab/cache/f82d0ea88ebda9ddb629ac4741d2b80b_x_Thumbnail800.jpg

Ilmu data atau yang mungkin kita dengar dengan data science dibangun oleh 3 pilar. Ketiga pilar tersebut adalah statistik, programming dan domain knowledge atau pengetahuan tentang bidang dimana ilmu data akan diterapkan.


Banyak literatur yang berkata demikian. Statistik sebagai salah satu pilar ilmu data tentunya bukan tanpa alasan. Statistik menjadi alat untuk mengukur sebagus apa model yang kita bangun. Apakah model ini valid dalam mengambil keputusan, dan sebagainya.


Statistik menjadi salah momok bagi banyak orang. Di Kampus, mata kuliah yang berhubungan dengan statistik akan selalu dianggap œmerusak IPK. Namun dalam mempelajari ilmu data, statistik menjadi hal tidak bisa dihindari, sekaligus harus dikuasai. Tentunya tidak perlu menguasai seluruh materi tentang statistik. Cukup mengetahui dasar-dasarnya terlebih dahulu. Adapun statistik tingkat lanjutnya bisa dipelajari sesuai kebutuhan atau dipelajari sambil mengerjakan project data science.


Salah satu materi yang perlu diketahui dalam statistik adalah distribusi normal. Nah, pada modul baru DQLab dengan judul œStatistik Dasar untuk Data Science dengan Python & Scikit - Mengenal Distribusi Normal dengan Python. Melalui modul ini, kita akan memperoleh materi diantaranya variabel acak, fungsi kepadatan peluang hingga teori limit pusat. Sebelum masuk ke ringkasan mengenai modul ini, yuk simak video singkatnya dibawah ini!


Video Part I



Video Part II 




1. Pengambilan Sampel

Data merupakan hal yang fundamental dalam data science. Tentu kita sepakat, tak akan ada hasil analisis tanpa data yang valid. Hampir selalu mustahil untuk mengambil seluruh data pada suatu pengamatan, dalam hal ini kita menyebutnya sebagai populasi.


Untuk itu diperlukan sampel yang dapat mewakili populasi tadi. Keluaran untuk setiap penarikan sampel dari suatu populasi yang dilakukan baik secara kualitatif maupun kuantitatif pasti akan berpusat pada aspek numerik sampel data. Aspek numerik sampel data ini diantaranya adalah rata-rata, varians, standar deviasi, kuartil, persentil, kuartil, dan yang lainnya.



2. Beberapa Konsep

Variabel acak adalah nilai keluaran untuk setiap data dari sampel yang ditarik disebut dengan variabel acak. Dengan menggunakan konsep variabel acak, modul ini akan mengajarkan bagaimana menemukan jumlah maupun peluang kemunculan suatu nilai.


Contoh bagaimana menjawab pertanyaan œberapa jumlah peluang kemunculan berat badan 66 kg? Selain itu tentunya ada pula konsep probability density function dan cumulative density function. Baik dalam konsep umumnya hingga ke pdf dan cdf distribusi normal.

 

Baca juga : Empat Jenis Data Statistik Hasil Pengukuran


3. Visualisasi Data Distribusi Normal

Apakah materi hanya berisi teks yang mungkin membuat bosan dan kurang menarik? Tentu tidak. Disini akan ada konsep menghitung frekuensi, frekuensi relatif dan lainnya menggunakan tabel. 

statistik


Tak lupa pula bagaimana ciri-ciri grafik dari data yang berdistribusi normal. Baik itu menggunakan histogram, boxplot dan grafik lainnya.

statistik


4. Pengenalan Python dalam Distribusi Normal

Setelah mempelajari teorinya, tidak ketinggalan bagaimana penerapan python dalam distribusi normal. Sebagai contoh kita akan membangkitkan data berdistribusi normal dengan mean dan standar deviasi yang kita tentukan sendiri. Lalu di akhir, akan divisualisasikan menggunakan histogram.

```
import numpy as np
import matplotlib.pyplot as plt
sampel = 20000
rerata = 5
deviasi = 1
data = np.random.normal(rerata, deviasi, sampel)
data
plt.hist(data, 20)
plt.show()
```


statistik

Dengan menggunakan sintaks di atas, kita sudah membangkitkan 20rb data yang berdistribusi normal. Dibuktikan dengan bentuk histogram seperti di bawah.


statistik


Baca juga : Belajar Statistika, Kenali Lebih Jauh Penerapannya dalam Data Science


5. Upskill Kompetensi Statistik Melalui Module Baru DQLab

Module œStatistik Dasar untuk Data Science dengan Python & Scikit - Mengenal Distribusi Normal dengan Python tentunya tidak hanya mempelajari pengambilan sampel hingga visualisasi datanya. Tapi kamu akan menguasai beberapa skill lainnya, diantaranya sebagai berikut :

  • Mampu mengetahui dan mengenal apa itu distribusi probabilitas pada statistik sebagai suatu fungsi yang menunjukkan kemungkinan nilai (probabilitas) yang ada pada suatu variabel dan frekuensi kemunculannya

  • Mampu mengetahui apa itu distribusi normal sebagai distribusi probabilitas, dan bagaimana pemanfaatannya secara umum

  • Mampu memahami Central Limit Theorem (CLT) dan kaitannya dengan distribusi normal

  • Mampu menghitung nilai probabilitas berdasarkan distribusi normal dengan mengetahui pada satu nilai dengan fungsi pdf (probability density function) dengan mengetahui nilai rata-rata dan standar deviasi.


Mampu menghitung nilai probabilitas berdasarkan distribusi normal dengan mengetahui pada rentang nilai dengan fungsi cdf (cumulative distribution function) dengan mengetahui nilai rata-rata dan standar deviasi


Ingin belajar lebih dalam mengenai distribusi normal menggunakan python? Kunjungi DQLab sekarang! Mulai karir mu menjadi seorang data scientist hari ini.


Cara akses modulenya gampang, mulai dengan sigup di DQLab.id dan masuk ke Academy DQLab untuk pilih menu module dan kamu bisa langsung mengerjakan module baru œStatistik Dasar untuk Data Science dengan Python & Scikit - Mengenal Distribusi Normal dengan Python. Yuk, tunggu apa lagi? Buruan gabung dan nikmati semua fasilitasnya hanya di DQLab!


Penulis: Ashari Ramadhan

Mulai Karier
sebagai Praktisi
Data Bersama
DQLab

Daftar sekarang dan ambil langkah
pertamamu untuk mengenal
Data Science.

Buat Akun


Atau

Sudah punya akun? Login