Buat Akun DQLab & Akses Kelas Data Science Python, R, SQL, Excel GRATIS!

Ilmu Statistik dalam Market Basket Analysis

Belajar Data Science di Rumah 18-Februari-2022
https://dqlab.id/files/dqlab/cache/8e835986cb27f18fae53d2c923c0d917_x_Thumbnail800.jpg

Analisis Basket adalah salah satu teknik statistik utama yang digunakan oleh pengecer besar untuk mengungkap hubungan antar item. Ia bekerja dengan mencari kombinasi item yang sering terjadi bersamaan dalam transaksi. Dengan kata lain, ini memungkinkan pengecer untuk mengidentifikasi hubungan antara barang-barang yang dibeli orang. Aturan Asosiasi banyak digunakan untuk menganalisis keranjang ritel atau data transaksi, dan dimaksudkan untuk mengidentifikasi aturan kuat yang ditemukan dalam data transaksi menggunakan ukuran daya tarik, berdasarkan konsep aturan kuat.


Saat ini Machine Learning membantu Industri Ritel dalam berbagai cara. Anda dapat membayangkan bahwa dari memperkirakan kinerja penjualan untuk mengidentifikasi pembeli, ada banyak aplikasi pembelajaran mesin (ML) di industri ritel. œAnalisis Keranjang Pasar adalah salah satu aplikasi pembelajaran mesin terbaik di industri ritel. Dengan menganalisis perilaku pembelian pelanggan di masa lalu, kita dapat mengetahui produk mana yang sering dibeli bersama oleh pelanggan.


Di bisnis ritel, salah satu inovasi teknologi adalah analisa otomatis terhadap ribuan sampai jutaan data transaksi untuk mendapatkan kombinasi produk yang sering dibeli bersamaan. Dari berbagai studi kasus, informasi kombinasi ini dapat digunakan untuk meningkatkan penjualan 18% sampai dengan 60%. Selain efektif untuk meningkatkan penjualan, informasi ini sekaligus bisa digunakan untuk memecahkan masalah stok. Kenapa bisa? Karena apabila stok yang sebelumnya menumpuk, kini dapat dicari pasangan produk yang tepat untuk dipaketkan bersama.


Lalu bagaimana statistik menjawab malalui logika market basket analysis?


1. Apa itu Analisis Keranjang Pasar?

Penambangan itemset yang sering mengarah pada penemuan asosiasi dan korelasi antara item dalam kumpulan data transaksional atau relasional yang sangat besar. Dengan sejumlah besar data yang terus dikumpulkan dan disimpan, banyak industri menjadi tertarik untuk menambang pola semacam itu dari database mereka. Pengungkapan "Hubungan Korelasi" di antara sejumlah besar catatan transaksi dapat membantu dalam banyak proses pengambilan keputusan seperti desain katalog, pemasaran silang, dan Analisis perilaku belanja pelanggan.


statistik


Contoh populer dari penambangan itemset yang sering adalah Analisis Keranjang Pasar. Proses ini mengidentifikasi kebiasaan membeli pelanggan dengan menemukan hubungan antara berbagai item yang ditempatkan pelanggan di "keranjang belanja" mereka seperti yang dapat Anda lihat pada gambar berikut. Penemuan asosiasi semacam ini akan sangat membantu bagi pengecer atau pemasar untuk mengembangkan strategi pemasaran dengan memperoleh wawasan tentang item mana sering dibeli bersama oleh pelanggan.


Misalnya, jika pelanggan membeli susu, bagaimana mungkin mereka juga membeli roti (dan jenis roti apa) dalam perjalanan yang sama ke supermarket? Informasi ini dapat menyebabkan peningkatan penjualan dengan membantu pengecer untuk melakukan pemasaran selektif dan merencanakan ruang langkan mereka.


Baca juga : Pengolahan Data Statistik Parametrik dan Non-Parametrik


2. Algoritma Apriori

Algoritma Apriori adalah algoritma Aturan Asosiasi yang banyak digunakan dan terkenal dan merupakan algoritma populer yang digunakan dalam analisis keranjang pasar. Ini juga dianggap sebagai algoritma AIS dan SETM yang akurat dan berlebihan. Ini membantu untuk menemukan itemset yang sering terjadi dalam transaksi dan mengidentifikasi aturan asosiasi antara item-item ini. Keterbatasan Algoritma Apriori adalah pembangkitan itemset yang sering. Perlu memindai database berkali-kali yang mengarah pada peningkatan waktu dan mengurangi kinerja karena ini merupakan langkah komputasi yang mahal karena database yang sangat besar. Ini menggunakan konsep Keyakinan, Dukungan.


3. Algoritma AIS

Algoritma AIS membuat beberapa lintasan di seluruh basis data atau data transaksional. Selama setiap pass, itu memindai semua transaksi. Seperti yang Anda lihat, pada lintasan pertama, ia menghitung dukungan dari item-item terpisah dan kemudian menentukan item mana yang sering ada di database. Itemset besar dari setiap pass diperbesar untuk menghasilkan kandidat itemset. Setelah setiap pemindaian transaksi, kumpulan item umum antara kumpulan item ini dari pass sebelumnya dan kemudian item dari transaksi ini adalah

ditentukan. Algoritma ini adalah algoritma pertama yang diterbitkan yang dikembangkan untuk menghasilkan semua itemset besar dalam basis data transaksional. Itu berfokus pada peningkatan database dengan kinerja yang diperlukan untuk memproses pendukung keputusan. Teknik ini terbatas pada hanya satu item dalam konsekuen.

  • Keuntungan: Algoritma AIS digunakan untuk mengetahui apakah ada hubungan antar item atau tidak.

  • Kekurangan: Kerugian utama dari algoritma AIS adalah menghasilkan terlalu banyak kandidat yang setelah itu ternyata menjadi kecil. Serta struktur data yang harus dijaga.


4. Pertumbuhan FP

Pertumbuhan FP dikenal sebagai Algoritma Pertumbuhan Pola Sering. Algoritma pertumbuhan FP adalah konsep yang merepresentasikan data dalam bentuk pohon FP atau Frequent Pattern. Karenanya FP Growth adalah metode Mining Frequent Itemsets. Algoritma ini merupakan kemajuan dari Algoritma Apriori. Tidak perlu generasi kandidat untuk menghasilkan pola yang sering. Struktur pohon pola yang sering ini mempertahankan hubungan antara kumpulan item.

statistik


Pohon Pola Sering adalah struktur pohon yang dibuat dengan kumpulan data sebelumnya. Tujuan utama dari pohon FP adalah untuk menambang pola yang paling sering. Setiap node dari pohon FP mewakili item dari itemset itu. Node akar mewakili nilai nol sedangkan node yang lebih rendah mewakili kumpulan item data. Asosiasi node ini dengan node yang lebih rendah yang berada di antara itemset dipertahankan saat membuat pohon.


Baca juga : Yuk Pelajari Macam-Macam Metode Analisis Statistika


5. Belajar Data Otodidak dan Mandiri Bersama DQLab

Halo sahabat data, Yuk Belajar dirumah aja bersama DQLab. Nikmati modul interaktif dan pembelajaran aplikatif bersama DQLab dan tentunya kamu tidak perlu melakukan instalasi environment anti ribet. DQLab sudah menyediakan semua yang kamu butuhkan untuk belajar. Mulai dari Modul sampai ke sertifikat Completion. Yuk Mulai Karir Datamu bersama DQLab.




Mulai Karier
sebagai Praktisi
Data Bersama
DQLab

Daftar sekarang dan ambil langkah
pertamamu untuk mengenal
Data Science.

Buat Akun


Atau

Sudah punya akun? Login