Buat Akun DQLab & Akses Kelas Data Science Python, R, SQL, Excel GRATIS!

Macam Jenis Dataset Data Science yang Digunakan pada Industri

Belajar Data Science di Rumah 25-April-2022
https://dqlab.id/files/dqlab/cache/48e6e74f4e2e26f31052d30489d08558_x_Thumbnail800.jpg

Sahabat DQ pemula dan ingin memperdalam kompetensi data science? Bisa! Era Digital saat ini sangat terbuka untuk siapa saja bisa menjadi calon talent data. Tidak memandang background pendidikan, Sahabat DQ yang berasal dari non IT pun dapat mempelajari data science dan memiliki peluang yang sama untuk berkarir di industri data.


Untuk mempersiapkan kompetensi tersebut, tentunya Sahabat DQ juga perlu tahu bagaimana keseharian seorang praktisi data dan dataset apa saja yang dipergunakan untuk bisa menunjang proses pengolahan data.


1. Numerical Dataset

Kumpulan data yang berisikan angka-angka, dimana Numerical Dataset kerap kali dikenal dengan data kuantitatif. Data ini bersifat numerik dimana dataset ini dapat membantu menghasilkan insight untuk kebutuhan bisnis. Data yang dianalisis dapat berupa data statistik, data hasil survei, data perusahaan, dan lain-lain.


Contohnya saat kamu sedang mengumpulkan data-data usia dari pasien, tentunya data yang kamu gunakan adalah Numerical Dataset dimana data yang kamu peroleh hanya berupa angka umur pasien.


Baca juga: Teknik Analisis Data yang Pemula Wajib Coba


2. Correlation Dataset

Dataset yang memiliki korelasi atau kesinambungan. Data tersebut saling terhubung satu dengan yang lainnya. Salah satu contohnya adalah, pengumpulan data toko kopi dan toko susu, jika penjualan kopi meningkat akan berkesinambungan dengan toko penjual susu karena saat ini sedang marak es kopi susu yang cukup trend pada masa kini.


3. Categorical Dataset

Dataset ini merupakan data yang menggabungkan banyak data kedalam beberapa kategori atau pengelompokkan. Contoh sederhananya adalah gender dimana data yang dimiliki dapat dikategorikan apakah data perempuan maupun data laki-laki.


4. Bivariate Dataset

Bivariate dataset ini merupakan data dengan dua variabel. Jadi kedua jenis data ini hanya menggambarkan dua variabel saja.

Bingung dengan penjelasannya? Berikut contohnya, jika kamu ingin menghitung bonus gaji karyawan kamu bisa mengukur dengan dua variabel ini :

  • Target yang dicapai oleh karyawan tersebut

  • Jumlah keuntungan yang diraih perbulannya

Karena kedua data tersebut saling berhubungan, maka data tersebut dapat dikatakan Bivariate Dataset.


Baca juga: Langkah-Langkah Menggunakan Teknik Analisis Data Kualitatif


5. Multivariate Dataset

Jika sebelumnya kita membahas Bivariate dimana ada dua variabel, untuk Multivariate ini lebih dari dua variabel yang digunakan. Salah satu contoh sederhana adalah data Mahasiswa di Universitas, tentunya kamu perlu beberapa data diantaranya nama, umur, alamat dan lulusan dari sekolah apa.


Karena data yang tersedia sebanyak 4 variabel maka kamu menggunakan beberapa tipe multivariate dataset.


Bagaimana, mudah bukan membedakan macam-macam dataset yang saat ini sering digunakan di Industri. Yuk, pelajari lebih dalam bersama DQLab untuk gali potensi kamu dalam mengolah data.


Caranya mudah, kamu bisa langsung isi form di bawah ini untuk mulai belajar di DQLab tanpa perlu instalasi software tambahan!


Tunggu apa lagi? Yuk, sign up sekarang!

Mulai Karier
sebagai Praktisi
Data Bersama
DQLab

Daftar sekarang dan ambil langkah
pertamamu untuk mengenal
Data Science.

Buat Akun


Atau

Sudah punya akun? Login