Buat Akun DQLab & Akses Kelas Data Science Python, R, SQL, Excel GRATIS!

Kenali Metode Statistik dalam Perbandingan Model Regresi

Belajar Data Science di Rumah 18-Januari-2022
https://dqlab.id/files/dqlab/cache/8ce05dad0bbc56a08457e5b514482755_x_Thumbnail800.jpg

Variasi data statistik yang beragam mengindikasikan perlunya analisis statistik yang tepat juga. Salah satu metode statistik yang biasanya digunakan adalah analisis regresi. Model regresi merupakan analisis data yang menggambarkan hubungan antara variabel respon dengan satu atau beberapa variabel bebas. Pada umumnya analisis regresi digunakan untuk menganalisis data dengan variabel respon berupa data kuantitatif. Akan tetapi dalam kehidupan sehari-hari sering ditemui kasus dengan variabel responnya berupa variabel kualitatif atau variabel dummy dengan mengambil dua atau lebih nilai “ nilai yang mungkin, seperti keputusan memilih œya atau œtidak. Tidak menutup kemungkinan pula kita membutuhkan data-data kualitatif untuk mendukung pernyataan kuantitatif kita. Dengan tipe data yang berbeda, maka analisis regresi akan berbeda pula. Pada umumnya akan dilakukan pengkategorian data yang disebut dengan data kategorik. Data kategorik digunakan untuk membedakan antara variabel respon dan variabel penjelas dimana menitikberatkan pada variabel respon yang bersifat kategorik, membedakan menurut skala pengukuran yang menitikberatkan pada variabel respon skala nominal atau ordinal, membedakan antara data diskrit atau kontinu dimana data kontinu yang telah dikategorikan, dan membedakan menurut kuantitatif dan kualitatif data. 


Analisis data kategorik dan data numerik dibedakan berdasarkan ukuran-ukuran statistik yang dapat digunakan dan berdasarkan distribusi probabilitas data. Pemodelan data kategorik lebih mudah digunakan karena asumsi yang harus terpenuhi lebih sederhana daripada pemodelan data numerik. Beberapa model data kategorik yang umum digunakan oleh penelitian adalah model logistik biner, probit, dan complementary log-log. Salah satu contoh kasus data kategorik adalah status kerja, dimana terdapat dua kategori status kerja yaitu bekerja dan tidak bekerja. Contoh lagi data kategorik adalah status keanggotaan, apakah dia tergolong anggota komunitas tertentu atau bukan anggota. Lalu, kira-kira apa saja sih penjabaran dari masing-masing perbandingan model regresi berikut. Yuk mari kita jawab rasa penasaran kamu lewat artikel berikut ini ya! Pada artikel DQLab kali ini, kita akan membahas mengenai perbandingan model regresi dan apa saja perbedaannya. Dengan harapan bisa menjadi tambahan insight dan rekomendasi bagi kalian calon praktisi data, pemula data maupun data enthusiast. Jangan lewatkan artikel berikut ini, pastikan simak baik-baik, stay tune and keep scrolling on this article guys! 


1. Regresi Logit

Kita masuk ke jenis regresi yang pertama yaitu regresi logistik. Bagi yang belum familiar regresi logistik ini juga dikenal dengan regresi logit. Secara definisi regresi logit adalah salah satu jenis regresi yang menghubungkan antara satu atau beberapa variabel independen (variabel bebas) dengan variabel dependen (variabel terikat) berupa variabel nominal. Variabel ini ditandai dengan nilai 0 dan 1. Sehingga nilainya hanya terdiri dari 2 nilai saja. Jenis variabel dependen berupa nominal inilah yang membedakan antara regresi logistik atau logit dengan regresi berganda maupun linear pada umumnya. Misalnya sahabat DQ ingin melakukan penelitian dengan menggunakan variabel dependen yaitu keputusan petani memilih pola tanam dalam sistem budidaya wortel. Kemudian kalian membedakan nih dengan dua nilai. Nilai 0 diperuntukkan bagi petani yang belum menerapkan pertanian organik dalam sistem pertanian wortel. Sedangkan nilai 1 dikhususkan bagi petani yang sudah menerapkan pertanian organik dalam sistem pertanian wortel. 


Misalnya lagi kalian ingin menguji keputusan anggota untuk bergabung atau tidaknya dalam sebuah koperasi. Berarti kalian bisa bedakan nilai 1 untuk anggota koperasi menyatakan bergabung dan 0 adalah anggota koperasi yang tidak bergabung. Seandainya regresi berganda apakah bisa untuk dianalisis? Jawabannya tidak bisa. Karena penjelasan persamaan yang menghubungkan antara variabel independen dan variabel dependen tidak bisa dilakukan secara linear seperti yang dilakukan pada regresi umumnya. Maka penggunaan regresi logistik diperlukan untuk menghitung peluang kecenderungan responden untuk bernilai 0 hingga 1. Disinilah letak perbedaannya.


Baca juga : Pengolahan Data Statistik Parametrik dan Non-Parametrik


2. Regresi Tobit

Selanjutnya adalah regresi Tobit. Regresi tobit pertama kali dikemukakan oleh James Tobin pada 1958 ketika ia menganalisa pengeluaran para rumah tangga di Amerika Serikat untuk membeli mobil. Pengeluaran untuk mobil di beberapa rumah tangga menjadi nol (karena rumah tangga tersebut tidak membeli mobil), dan hal ini sangat berpengaruh terhadap hasil analisa regresi. Ia menemukan bahwa jika tetap menggunakan OLS, perhitungan parameter akan cenderung mendekati nol juga dan menjadi tidak signifikan, atau jika menjadi signifikan, nilainya mengalami bias (terlalu tinggi atau terlalu rendah) dan juga tidak konsisten (jika ada data baru, hasilnya tidak sama atau tidak sesuai dengan hasil semula). 


Regresi Tobit biasanya digunakan untuk meneliti variabel-variabel yang sifatnya sosial dan ekonomi. Dengan demikian regresi tobit adalah analisis yang bisa dijadikan referensi. Metode regresi tobit mengasumsikan bahwa variabel-variabel bebas tidak terbatas nilainya (non-censured); hanya variabel tidak bebas yang censured; semua variabel (baik bebas maupun tidak bebas) diukur dengan benar; tidak ada autocorrelation; tidak ada heteroscedasticity; tidak ada multikolinearitas yang sempurna; dan model matematis yang digunakan menjadi tepat.


3. Regresi Probit

Regresi Probit sekilas hampir serupa dengan regresi logit. Hal yang membedakan antara keduanya adalah pada model regresi yang terbentuk. Jika model logistik diselesaikan dengan menggunakan fungsi distribusi kumulatif dari distribusi logistik. Sedangkan model regresi probit digunakan fungsi distribusi kumulatif dari distribusi normal. Analisis regresi probit adalah analisis yang digunakan untuk melihat hubungan antara variabel dependen yang bersifat kategori (kualitatif) dan variabel-variabel independen yang bersifat kualitatif maupun kuantitatif. Model probit menggunakan Normal Cumulative Distribution Function (CDF). Model probit merupakan model non linier yang digunakan untuk menganalisis hubungan antara satu variabel dependen dengan beberapa variabel independen, dengan variabel dependennya berupa data kualitatif dikotomi yaitu bernilai 1 untuk menyatakan keberadaan sebuah karakteristik dan bernilai 0 untuk menyatakan ketidakberadaan sebuah karakteristik.


4. Regresi Complementary Log-Log

Regresi complementary log-log merupakan model regresi yang dapat menjelaskan hubungan antara variabel respon yang bersifat kategorik dikotom dengan variabel prediktor baik yang bersifat kategorik maupun kontinu. Regresi complementary log-log berkaitan erat dengan distribusi gompertz. Regresi complementary log-log adalah suatu metode analisis data yang digunakan untuk menjelaskan hubungan antara variabel respon yang bersifat dikotomi yang dikategorikan berdasarkan threshold tertentu dengan variabel penjelas.


Baca juga : Yuk Pelajari Macam-Macam Metode Analisis Statistika


5. Belajar Statistika Sampai Mahir Bersama DQLab!

Agar skill statistik kamu semakin terasah, tidak salah lagi jika kamu bisa upgrade skill mu bersama DQLab! Kamu bisa loh untuk coba bikin akun gratisnya kesini di DQLab.id dan lakukan signup untuk dapatkan info-info terbaru serta belajar data science. Banyak benefit yang bisa kamu dapatkan jika kamu bergabung untuk belajar bersama DQLab! Nikmati pengalaman belajar data science yang menarik dan cobain berlangganan bersama DQLab yang seru dan menyenangkan dengan live code editor. Cobain juga free module Introduction to Data Science with R dan Introduction to Data Science with Python untuk menguji kemampuan data science kamu gratis! Jika ingin berlangganan kalian bisa mendapatkan benefit yang beragam salah satunya mencoba modul platinum dan career track.


Dapatkan keuntungan-keuntungan yang didapatkan salah satunya tidak perlu install software tambahan. Karena kalian belajar secara langsung terhubung dengan live code editor dari device yang kalian gunakan. Kalian juga bisa mencoba studi kasus penerapan real case industry. Jika kamu kesulitan dalam proses pembelajaran di DQLab, kamu bisa loh gabung ke discord kita untuk menanyakan hal-hal yang kurang jelas dan bingung bagaimana cara penyelesaiannya. Kamu juga diberikan kesempatan mendapatkan job connector dari perusahaan ternama di ranah industri data. Uniknya kamu bisa langsung apply dari akun kamu loh. So, tunggu apalagi, buruan SIGNUP Sekarang ya!


Penulis: Reyvan Maulid


Mulai Karier
sebagai Praktisi
Data Bersama
DQLab

Daftar sekarang dan ambil langkah
pertamamu untuk mengenal
Data Science.

Buat Akun


Atau

Sudah punya akun? Login