Buat Akun DQLab & Akses Kelas Data Science Python, R, SQL, Excel GRATIS!

Contoh Implementasi Data Sekunder dalam Data Science

Belajar Data Science di Rumah 14-Januari-2022
https://dqlab.id/files/dqlab/cache/a1f2034eb9f64b035ff9dc654254f020_x_Thumbnail800.jpg

Suatu penelitian tentu akan memerlukan data. Jenis datanya tergantung pada tema dan tujuan penelitian yang kamu lakukan. Data sekunder dan data primer merupakan jenis data berdasarkan cara memperolehnya yang sering digunakan dalam penelitian. Apa bedanya? Data primer diperoleh secara langsung dan berperan sebagai data utama. Sedangkan data sekunder adalah data yang diperoleh dari pihak ketiga dan berperan sebagai data pendukung data primer. Jadi, jika data primer yang dikumpulkan untuk penelitian masih membutuhkan data pelengkap, kita bisa menambahkan data-data sekunder yang bisa didapatkan dari buku, jurnal, karya ilmiah, dan penelitian terdahulu. Namun ada juga loh penelitian yang hanya menggunakan data sekunder yang disebut meta-study.


Teman-teman yang suka belajar data pasti tidak asing dengan istilah data science. Ini merupakan bidang ilmu yang mengkombinasikan tiga pilar ilmu yaitu matematika, statistika, dan pemrograman untuk memudahkan pengolahan data. Secara umum penelitian akan melalui proses pengolahan data yaitu pengumpulan data, pengelompokkan data, validasi data, manipulasi data, pemrosesan data, penyajian data, serta melakukan penarikan kesimpulan yang bertujuan untuk menyelesaikan permasalahan penelitian. Nah, data sekunder bisa juga diolah dengan data science, loh. Seperti apa contoh implementasinya? Yuk, simak pembahasannya di bawah ini!


1. Fraud Risk Detection

Fraud risk adalah jenis resiko yang umum dihadapi perusahaan. Fraud bisa berdampak bagi perusahaan mulai dari kerugian finansial hingga reputasi perusahaan yang rusak. Fraud ini dapat termasuk penipuan pajak, penipuan kartu kredit, penipuan sekuritas, dan penipuan keuangan. Beberapa perusahaan melakukan tindakan pencegahan dengan audit. Nah, dengan data science pengembang bisa membangun sistem yang mendeteksi adanya aktivitas mencurigakan. Fraud detection biasanya digunakan industri keuangan dan perbankan agar dapat mengetahui jika terjadi anomali data. Praktisi data dapat menggunakan teknik analisis data atau Artificial Intelligence (AI).


Baca juga : Teknik Pengumpulan Data Sekunder, Apa Saja Sumber Data yang Bisa Digunakan?


2. Customer Segmentation

Customer Segmentation merupakan metode pengolahan data yang membagi pembeli dalam karakteristik tertentu. Pengelompokkan ini bertujuan untuk mengetahui karakteristik pelanggan atau pembeli agar perusahaan dapat memasarkan produknya kepada masing-masing kelompok secara efektif. Ada beberapa jenis customer segmentation yaitu demographic segmentation, geographic segmentation, behavioral segmentation, dan psychographic segmentation. Metode bisa menggunakan data sekunder seperti data penjualan di setiap cabang. Customer segmentation ini penting dalam bisnis karena bisa memberikan insight yang berguna dalam menciptakan strategi marketing, untuk pengembangan produk, hingga membantu untuk menetapkan harga dari produk


3. Medical Image Analysis

Data science juga digunakan dalam dunia kesehatan salah satunya yaitu medical image analysis. Medical image analysis merupakan sistem untuk mendeteksi tumor, stenosis arteri, dan CT scan dengan menerapkan metode MapReduce agar mampu mengklasifikasikan kondisi paru-paru. Biasanya dokter akan melakukan pemeriksaan medis dan mencari petunjuk dari citra medis secara manual. Namun dengan kemajuan teknologi sekarang seperti data science, machine learning, deep learning, dan lainnya memungkinkan data scientist membuat mesin yang mampu mendeteksi citra medis yang lebih kompleks secara otomatis. 


4. Customer Churn

Setiap bisnis pasti menginginkan keuntungan. Untuk memaksimalkan keuntungan, perusahaan dapat melakukan pembaruan strategi marketing, memperbarui kemasan produk, dan lain sebagainya. Namun ada kalanya bisnis mengalami penurunan karena kehilangan pelanggan. Inilah yang disebut customer churn yaitu hilangnya pelanggan dari suatu bisnis. Churn dihitung dari berapa banyak pelanggan yang meninggalkan bisnis dalam kurun waktu tertentu. Customer churn penting diketahui bisnis sebagai gambaran kesuksesannya dalam mempertahankan pelanggan. Data sekunder yang diambil bisa dari data dalam kurun waktu tertentu untuk jumlah pelanggan. Perusahaan harus mengetahui alasan-alasan apa yang menyebabkan pelanggan meninggalkan bisnis sehingga perusahaan lebih cepat menanggulangi kondisi tersebut. Karena jika dibiarkan saja bisa menyebabkan kerugian yang besar. 


Baca juga : Metode Pengumpulan Data Sekunder, Bisa Menggunakan Apa Saja Sih?


5. Belajar Metode Pengolahan Data Sekunder Lainnya di DQLab

Metode pengolahan data yang digunakan oleh praktisi data ada banyak tergantung permasalahan yang ingin diselesaikan. Oleh karena itu, jika kamu ingin menjadi praktisi data seperti Data Analyst kamu harus eksplorasi berbagai metode pengolahan data serta tools yang mendukung. Data sekunder untuk keperluan mengolah data bisa kamu dapatkan dari Kaggle, situs BPS, atau melakukan web scraping. Buat kamu yang masih pemula jangan khawatir, kamu tetap bisa menjadi praktisi data salah satunya dengan mengikuti kursus data science online. DQLab merupakan lembaga kursus data science yang memberikan pembelajaran intensif untuk sahabat data yang ingin menjadi praktisi data handal. Modul-modul terstruktur serta project yang ada akan meningkatkan skill datamu. Modul gratis juga ada, loh! Daftar di DQLab.id sekarang, yuk untuk dapat akses ke modul gratis Python dan R!


Penulis: Dita Kurniasari

Editor: Annissa Widya


Mulai Karier
sebagai Praktisi
Data Bersama
DQLab

Daftar sekarang dan ambil langkah
pertamamu untuk mengenal
Data Science.

Buat Akun


Atau

Sudah punya akun? Login