DATA MINING MENENTUKAN POLA
PENJUALAN PRODUK ELEKTRONIK MENGGUNAKAN ALGORITMA APRIORI (STUDI KASUS TOKO
MASTER ELEKTRONIK MEDAN)
Riki Satria
14110222
Mahasiswa Program Studi Teknik Informatika STMIK Budi
Darma Medan
JL.Sisingamangaraja No.338 Sp.Limun Medan
http :
//www.stmik-budidarma.ac.id// Email : rikisatria40@gmail.com
ABSTRAK
Penjualan adalah sebuah usaha atau langkah kongkrit yang
dilakukan untuk pemindahan suatu produk baik itu berupa barang atau jasa, dari
produsen kepada konsumen sebagai sasaranya. Tujuan utama penjualan adalah
mendatangkan keuntungan atau laba dari produk ataupun barang yang dihasilkan
produsennya dengan pengolahan yang baik.
Data mining adalah proses yang
memperkerjakan satu atau lebih teknik pembelajaran komputer (machine learning)
untuk menganalisis dan mengektraksi pengetahuan (knowledge) secara otomatis.
Defenisi lain diantaranya adalah pembelajaran berbasis induksi (induction_based
learning) adalah proses pembentukan defenisi-defenisi konsep konsep umum yang
dilakukan secara mengobservasi contoh-contoh spesifik dari konsep-konsep yang
akan dipelajari.
Algoritma Apriori pada saat ini
telah diimplementasikan keberbagai bidang, salah satunya adalah dibidang bisnis
atau perdagangan dan bidang pendidikan, dibidang bisnis misalnya implementasi
data mining algoritma apriori untuk sistem penjualan tujuanya untuk membantu
para pembisnis meningkatkan penjualan produk, sedangkan dibidang pendidikan
misalnya implementasi data mining untuk menemukan pola hubungkan tingkat
kelulusan mahasiswa dengan data induk mahasiwa.
Kata kunci : penjualan, data mining, algritma apriori
1.
PENDAHULUAN
1.1
Latar Belakang Masalah
Algoritma Apriori pada saat ini telah
diimplementasikan keberbagai bidang, salah satunya adalah dibidang bisnis atau
perdagangan dan bidang pendidikan, dibidang bisnis misalnya implementasi data
mining algoritma apriori untuk sistem penjualan tujuanya untuk membantu para
pembisnis meningkatkan penjualan produk, sedangkan dibidang pendidikan misalnya
implementasi data mining untuk menemukan pola hubungkan tingkat kelulusan
mahasiswa dengan data induk mahasiwa. (Efori, 2013:8)
Data penjualan pada toko master
elektronik selama ini tidak tersusun dengan baik, sehingga data tersebut hanya
berfungsi sebagai arsip bagi perusahaan dan tidak dapat dimanfaatkan untuk
pengembangan strategi pemasaran. Dalam penjualan produk elektronik pada toko
Master ini diperlukan data mining
untuk menentukan pola kombinasi produk elektronik. Data mining merupakan analisis data menggunakan tools untuk menemukan pola
dan aturan dalam himpunan data. Penulis
mengunakan tools tanagra 1.4 dalam data mining
untuk memprediksi permintaan customer
dalam penjualan produk elektronik
pertahun berikutnya berdasarkan data
transaksi tahunan sebelumnya, Proses pengambilan keputusan itu sendiri
membutuhkan informasi yang akurat. Informasi tersebut didapat dengan memproses
data yang tersedia Saat ini, proses analisa yang berkaitan dengan kegiatan
transaksi yang dilakukan dengan kurang baik. Maka dalam penelitian ini penulis
meminta data di perusahaan kemudian diproses mengunakan Software Tanagra dan data tersebut secara terkomputerisasi
dapat lebih baik, sehingga diperoleh
informasi yang strategik.
Oleh
karena itu dibutuhkan suatu pendekatan baru yang dapat menyediakan informasi
strategik. Data mining merupakan paradigma baru yang secara spesifik mampu
menyediakan informasi strategik bagi kelangsungan perusahaan, dimana informasi
tersebut sangat penting untuk lingkungan hidup perusahaan. Sebagai proses
analisis untuk kemajuan perusahaan.
1.2
Perumusan
Masalah
Dari
latar belakang di atas agar hasil
penelitian menjadi lebih terarah dengan tujuan yang diharapkan maka
ditemukan rumusan masalah, yaitu :
1.
Bagaimana menentukan pola penjualan produk elektronik
dengan menggunakan data mining.
2.
Bagaimana menerapkan
metode apriori pada data mining untuk menentukan pola penjualan
produk elektronik pada perusahaan.
3.
Bagaimana menggunakan software Tanagra sebagai penguji
dari data penjualan produk
elektronik dengan data mining.
1.3
Batasan
Masalah
Agar hasil penelitian menjadi lebih terarah dengan
tujuan yang diharapkan, maka perlu adanya batasan masalah antara lain :
1.
Sistem
ini hanya membahas untuk menentukan pola penjualan produk elektronik
berdasarkan kriteria seperti merk dengan menggunakan data mining dengan metode Algoritma apriori.
2.
Sample data yang
digunakan adalah data penjualan
produk elektronik yang ada di Toko Master Elekronik ini merupakan data
tahun 2014.
3.
Software yang dipergunakan
adalah Tanagra 1.4 sebagai
implementasi dan memanfaatkan tools tanagra
pada Microsoft Excel 2007.
1.1
Tujuan dan Manfaat Penelitian
1.1.1
Tujuan
Penelitian
Adapun tujuan dari penelitian yang dilakukan di
perusahaan diantaranya adalah :
1.
Mengelompokan data penjualan produk elektronik dengan mengunakan data mining
perusahaan dapat memprediksi permintaan costumer terhadap pengeluaran produk
elektronik.
2.
Menerapkan apriori, dari data penjualan produk elektronik, agar pengolah data dalam perusahan dapat lebih baik dengan menggunakan
metode tersebut.
3.
Mengunakan Algoritma
apriori sebagai implementasi data mining untuk stok produk elektronik yang ada pada perusahaan.
1.1.2
Manfaat
Penelitian
Adapun manfaat dari
penelitian yang dilakukan pada perusahaan diantaranya merupakan :
1.
Membantu perusahaan dalam
menentukan penjualan produk
elektronik
yang paling di minati konsumen
2.
Perusahaan dapat
memprediksi penjualan produk
elektronik
pada perusahaan dengan menggunakan metode apriori pada perusahaan.
3.
Perusahaan dapat memenuhi
kebutuhan konsumen sesuai dengan penjualan produk elektronik yang paling diminati sehingga persediaan
tidak akan kosong.
2
Landasan Teori
2.1 Data
Mining
Data mining
adalah proses yang memperkerjakan satu atau lebih tehnik pembelajaran
komputer (machine learning) untuk
menganalisis dan mengintegrasi suatu
pengetahuan secara otomatis. Defenisi lain diantaranya adalah
pemebleajaran berbasis induksi (induction-based
learning) proses pembentukan defenisi-defenisi konsep umum yang dilakukan
dengan cara mengobservasi contoh-contoh spesifik dari konsep-konsep yang akan
dipelajari knowledge Discovery in database adalah penerapan metode saintifik
pada data mining dalam konteks ini data mining merupakan satu langkah dari knowledge Discovery in database. Sumber: Fajar Astuti Hermawati 2013.
Data
mining berisi pencarian tren atau pola yang diinginkan dalam database besar
untuk membantu pengambilan keputusan diaktu yang akan datang. Pola-pola ini
dikenali oleh perangkat tertentu yang dapat memberikan suatu analisa data yang
berguna dan berwawasan yang kemudian dapat dipelajari dengan lebih teliti, yang
mungkin saja mengunakan perangkat pendukung keputusan yang lainnya.
Gambar
3.1 : Data mining dan teknologi
database
Sumber :
Fajar Astuti Data mining 2013
Dari gambar diatas terlihat
bahwa teknologi data warehouse digunakan untuk melakukan olap, sedangkan data
mining digunakan untuk melakukan Information
Anality (dengan ditambah visualisasi tentunya).
Dalam prakteknya, data mining juga mengambil data dari data warehouse.
2.2 Operasi Data Mining
Operasi data mining
menurut sifatnya dibedakan menjadi dua,yaitu bersifat prediksi (prediction driven) untuk menjawab
pertanyaan apa dan sesuatu yang bersifat remang-remang atau transparan. Operasi
prediksi digunakan untuk validasi hipotesis, queryring dan pelaporan
(misal : Spreadset dan pivot table ) serta
analisis multidimensi (dimensial summary). Olap (Online Anality Procesing) serta
analisis statistik. Penemuan (discovery
driven ) bersifat transparan untuk menjawab pertanyaan. Berikut proses
dalam pengunaan data mining yang merupakan proses knowledge discovery In database seperti yang terlihat pada gambar dibawah ini. Sumber: Fajar Astuti Hermawati, 2013.
Gambar 3.2 :
Proses knowledge discovery In database
Sumber :
Sumber : Fajar Astuti Data mining
2013
2.3 Langkah-Langkah Data Mining
Ada empat tahap yang dilalui dalam Data Mining
antara lain (Feen Lee & Juan Santana, 2010:37-40) :
1. Tahap pertama: Precise
statement of the problem (mendefinisikan permasalahan yang ingin
diketahui). Misalnya ingin mengetahui apakah seorang customer berpotensi memiliki kredit
macet, atau mengidentifikasi seorang customer
apakah akan pindah ke kompetitor
bisnis kita, dan lain sebagainya. Setelah menemukan pertanyaan bisnis yang
perlu dijawab oleh data mining, selanjutnya
tentukan tipe tugas untuk menjawab pertanyaan bisnis tersebut. Tugas dasar yang
menjadi dasar algoritma data mining
adalah klasifikasi, regresi, segmentasi,
asosiasi dan sequence analisis.
2. Tahap kedua: Initial
Exploration (Mempersiapkan data yang menjadi sumber untuk data mining
termaksud data “cleaning” untuk
mempelajari polanya). Setelah menemukan defenisi masalah, langkah berikutnya
adalah mencari data yang mendukung defenisi masalah. Menentukan porsi data yang
digunakan men-training data mining
berdasarkan algoritma data mining
yang telah dibuat. Setelah persiapan data selesai dilakukan, langkah berikutnya
adalah memberikan sebagian data kedalam algoritma data mining.
3. Tahap ketiga: Model building
and validation. Validasi apakah
data mining memberikan prediksi yang
akurat. Setelah training data selesai
dilakukan, data mining tersebut perlu
di-“uji” atau di-validasi keakuratannya terhadap data testing.
4. Tahap
ke-empat: Deployment. Tahap ini
memilih aplikasi yang tepat terhadap data mining untuk membuat prediksi.
2.4
Gudang
Data (Data WareHouse)
Data
mining berpotensi tinggi jika data yang
tepat dikumpulkan dan disimpan dalam sebuah gudang data (data warehouse). Sebuah gudang data merupakan suatu sistem
manajemen basis data relasional, yang didesain khusus untuk memenuhi kebutuhan
akan sistem pengolahan transaksi. Data warehouse, secara bebas dapat
didefenisikan sebagai tempat peyimpanan data terpusat yang dapat di-query untuk manfaat bisnis. Sumber : Fajar Astuti
Hermawati 2013.
2.5
Teknik Data Mining
Beberapa teknikdan sifat data
mining adalah sebagai berikut :
1.
Classification
( predictive)
2.
Clustering
(descriptive)
3. Association rule discovery (descriptive)
4. Sequential patren discovery
(descriptive)
5. Regresion (descriptive)
6. Devation detection (descriptive)
2.5
Klasifikasi
Klasifikasi adalah menentukan
sebuah record data baru kesalah satu
dari beberapa kategori (atau klas) yang telah didefenisikan sebelumnya. Disebut
juga dengan “supervised learning” berikut
beberapa tipe klasifikasi :
1. Penjualan
langsung (Direct Marketing)
Tujuan mengurangi costsurat menyurat dengan menentukan (Targeting) suatu konsumen yang mempuyai kesamaan dalam membeli
produk telepon selular baru.
2.
Costomer
Attrion/Churn
Untuk memprediksi pelanggan mana yang akan berpindah
ke komputer kita.
3.
Fraund
Detection
Memprediksi
kasus-kasus transaksi curang dengan mengunakan
kartu kredit.
Sumber:(Fajar
Astuti Hermawati 2013,10.
2.6
Fungsi
Dan Tugas Data Mining
Data mining
menganalisis data menggunakan tool
untuk menemukan pola dan aturan dalam himpunan data. Perangkat lunak bertugas
untuk menemukan pola dengan mengidentifikasi aturan dan fitur pada data. Tool data mining diharapkan mampu mengenal pola ini dalam data dengan input
minimal dari user (Dana Sulistiyo
Kusumo et al, 2003). Data
mining sering disebut knowledge discovery
in database(KDD), adalah kegiatan yang meliputi pengumpulan, pemakaian data
lama untuk menemukan peraturan pola atau hubungan dalam set data yng berukuran
besar. Keluaran dari data miningbisa
dipakai untuk memperbaiki pengambilan keputusan dimas depan. Sumber : (Budi
Santoso,2007)
2.7
Kaidah
Assosiasi (Association Rule)
Menditeksi
kumpulan atribut yang muncul bersamaan (co-occur)
dalam frekwensi yang sering ddan membentuk sejumlah kaidah dari
kumpulan-kumpulan tersebut.Contoh 90% orang yang belanja disupermarket yang membeli roti juga membeli selai, dan 60%
dari semua orang yang belanja membeli keduanya. Sumber: Fajar astuti hermawati 2013.
Jika
diberikan sekumpulan record yang masing-masing terdiri dari sejumlah itemdari
kumpulan yang diberikan akan menghasilkan aturan ketergantungan (Depency rules) yang memprediksi
kejadian item dari suatu item berdasarkan kejadian item lainya. Berikut
merupakan contoh dari beberapa kaidah Assisiation sebagai berikut :
1.
Marketing
and sales promotion
Misalkan diketahui aturan ketergantungan
dimana :
{Bagels,
...} --> {Potato Chips}
Potato chips sebagai consequent dapat digunakan untuk
menentukan apa yang dapat dilakukan untuk meningkatkan penjualan.
Bagels in the antecent dapat
digunakan untuk melihat produk mana yang akan terkena dampak jika toko tersebut
tidak lagi menjual bagels.
Bagels in antecendent and potato chips
in consenquent dapat melihat produk apa yang harus dijual dengan bagles untuk menentukan penjualan potato chips.
2.
Supermarket
Shelf management
Tujuan :
Untuk mengali item-item yang dibeli bersama-sama oleh cukup banyak pelanggan. Memproses data point-of-sale yangdikumpulakan dengan pemindai Barcode untuk
menentukan ketergantungan antar item.
Aturan
klasik jika pelanggan membeli diaper dan susumaka juga akan membeli beear, sehingga sehingga jangan kaget
jika akan menemukan enam beear yang
ditumpuk dekat diapers.
3.
Inventory
management
Tujuan :
Seorang pelangan perusahaan perbaikan peralatan mengharpkan keaslian dari
perbaikan produk konsumen dan menjaga
pelayanan dengan mengunakan suku cadang yang baik untuk mengurangi jumlah
kunjungan untuk rumah pelanggan.
Pendekatan : memproses data peralatan
dan suku cadang yang dibutuhkan pada perbaikan sebelumnya di tempat pelanggan
yang berbeda dan menemukan pola-pola kejadian yang berulang.
2.7.1 Algoritma Apriori
Algoritma apriori adalah adalah
algoritma yang paling terkenal untuk menemukan pola frekuensi tinggi. algoritma
apriori dibagi menjadi beberapa tahap yang disebut narasi atau pass. Sumber:
(Efori bulolo, 2010,10.)
1.
Pembentukan kandidat itemset,
kandidat k-itemset dibentuk dari kombinasi (k-1)-itemset yang
didapat dari iterasi sebelumnya. Satu cara dari algoritma apriori adalah adanya
pemangkasan kandidat k-itemset yang subset-nya yang berisi k-1
item tidak termasuk dalam pola frekuensi tinggi dengan panjang k-1.
2.
Penghitungan support dari
tiap kandidat k-itemset. Support dari tiap kandidat k-itemset didapat
dengan menscan database untuk menghitung jumlah transaksi yang memuat
semua item didalam kandidat k-itemset tersebut. Ini adalah juga
ciri dari algoritma apriori dimana diperlukan penghitungan dengan cara seluruh database
sebanyak k-itemset terpanjang.
3.
Tetapkan pola frekuensi
tinggi. Pola frekuensi tinggi yang memuat k item atau k-itemset ditetapkan
dari kandidat k-itemset yang supportnya lebih besar dari minimum support.
4.
Bila tidak didapat pola frekuensi tinggi baru maka seluruh proses
dihentikan. Bila tidak, maka k ditambah satu dan kembali bagian 1.
2.7.2 Association Rule
Analisis asosiasi atau association
rule mining adalah teknik data mining untuk menemukan aturan assosiatif
antara kombinasi item. Contoh dari aturan assosiatif dari analisa
pembelian di suatu pasar swalayan adalah dapat diketahui berapa besar
kemungkinan seseorang membeli roti bersamaan dengan susu. Dengan pengetahuan
tersebut pemilik pasar swalayan dapat mengatur penempatan barangnya atau
merancang kampanye pemasaran dengan memakai kupon diskon untuk kombinasi barang
tertentu. Sumber : Efori Buulolo
Association Rules Hal 4
2.5.3 Tahapan Association Rules
Analisis
asosiasi dikenal juga sebagai salah
satu teknik data mining yang menjadi dasar dari berbagai teknik data mining lainya. Khususnya salah satu
tahap dari analisis asosiasi yang
disebut analisis pola frekuensi tinggi (frequent pattern mining) menarik
perhatian banyak peneliti untuk menghasilkan algoritma yang efesien Sumber : Efori Buulolo Association Rules Hal 4
Metodologi
dasar analisis asosiasi terbagi menjadi dua tahap :
1. Analisa pola frekuensi tinggi
Tahap ini mencari kombinasi item yang
memenuhi syarat minimum dari
nilai support dalam database.
Nilai support sebuah item diperoleh dengan rumus berikut:
Support (A) = Transaksi mengandungandungA&B
TotaltransaksiMengadungA
Sedangkan nilai dari support 2 item diperoleh dari rumus
berikut :
Support (A,B) = P(AB) =jumlahTTransndungAdanB
Totaltransaksi
n
2. Pembentukan aturan assosiatif
Setelah
semua pola frekuensi tinggi ditemukan, barulah dicari aturan assosiatif yang memenuhi
syarat minimum untuk confidence dengan
menghitung confidence aturan
assosiatif A Nilai confidence dari
aturan A diperoleh dari rumus berikut :
Confidence
= P(B|A) = Jumlah
transaksi mengandung AdanB
Jumlah transaksi mengandung A
2.5.4 Langkah-Langkah Proses Perhitungan Association Rules
Proses
perhitungan association rule terdiri dari beberapa tahap adalah sebagai
berikut Sumber : Efori Buulolo Association Rules Hal 5
1.
Sistem men-scan database untuk
mendapat kandidat 1-itemset (himpunan item yang terdiri dari 1 item)
dan menghitung nilai supportnya. Kemudian nilai supportnya tersebut dibandingkan dengan minimum support yang
telah ditentukan, jika nilainya lebih besar atau sama dengan minimum support
maka itemset tersebut termasuk dalam large itemset.
2.
Itemset yang tidak termasuk dalam large itemset tidak diikutkan
dalam iterasi selanjutnya (di prune).
3.
Pada iterasi kedua sistem akan
menggunakan hasil large itemset pada iterasi pertama (L1)
untuk membentuk kandidat itemset kedua (L2). Pada iterasi
selanjutnya sistem akan menggunakan hasil large itemset pada iterasi
selanjutnya akan menggunakan hasil large itemset pada iterasi sebelumnya
(Lk-1) untuk membentuk kandidat itemset berikut (Lk).
Sistem akan menggabungkan (join) Lk-1 dengan Lk-1 untuk
mendapatkan Lk, seperti pada iterasi sebelumnya sistem akan
menghapus (prune) kombinasi itemset yang tidak termasuk dalam large
itemset.
4.
Setelah dilakukan operasi join,
maka pasangan itemset baru hasil proses join tersebut dihitung supportnya.
5.
Proses pembentuk kandidat
yang terdiri dari proses join dan prune akan terus dilakukan hingga
himpunan kandidat itemsetnya null, atau sudah tidak ada lagi kandidat
yang akan dibentuk.
6.
setelah itu, dari hasil frequent
itemset tersebut dibentuk association rule yang memenuhi nilai support
dan confidence yang telah ditentukan.
7.
Pada pembentukan association
rule, nilai yang sama dianggap sebagai satu nilai.
8.
Assosiotion rule yang terbentuk harus memenuhi nilai minimum yang telah
ditentukan.
Untuk setiap large itemset L, kita cari himpunan bagian L
yang tidak kosong. Untuk setiap himpunan bagian tersebut, dihasilkan rule dengan
bentuk aB(L-a)
jika supportnya (L) dan supportnya (a) lebih besar
dari minimum support.
2.5.5
Produk
Elektronik
Produk adalah segala sesuatu yang di
tawarkan kepasar untuk mendapatkan perhatian, dibeli, dipergunakan dan yang
dapat memuaskan keinginan atau kebutuhan konsumen. Elektronik adalah alat yang
dibuat berdasarkan prinsip elektronika serta hal atau benda yang menggunakan
alat tersebut.Antara lain dapat digunakan padaElektronik Konsumen. Elektronik
Konsumen adalah alat elektronik yang di tujukan untuk penggunaan sehari-hari
dan dapat di gunakan untuk hiburan, komunikasi, serta bisnis.Media Elektronik
merupakan sarana media masa yang mempergunakan alat elektronik modern, misal
radio, televisi dan lain-lain. (https://id.m.wikipedia.org/wiki/Elektronik).
3. Analisa
Selama ini
untuk menentukan pola data penjualan produk elektronik tidak dikelola secara terkomputerisasi yang
baik dan benar. Perusahaan sulit untuk melakukan proses analisa penjualan
produk elektronik. Berikut merupakan pembahasan dan analisa data penjualan
produk elektronik di toko Master Elektronik Medan. Berikut dilakukan proses
analisanya.
3.1. Analisis Data
Dengan studi kasus pada Toko Master
Elektronik Medan dapat dilakukan analisa prediksi terhadap data khusus data
penjualan (data produk elektronik keluar) dengan salah satu tujuanya adalah
untuk menemukan pola kombinasi penjualan produk elektronik dan hubungan antar item jenis produk elektronik dalam
transaksi. Berikut ini adalah tabel 4.1 beberapa sampel data yang akan
dijadikan sampel untuk analisis dan juga untuk pengujian.
Data penjualan
produk elektronik pada Toko Master Elektronik Medan selama 1 tahun, dimulai
pada bulan Januari 2014, sampai pada bulan Desember 2014. Berikut ini merupakan
data penjualan elektronik pada Toko Master Elektronik Medan :
Tabel 4.1 Data Transaksi Penjualan Produk Elektronik
No
|
No. Slip
|
Nama Item
|
1
|
2014.002.404
|
TV, KULKAS,
DVD, SPEAKER, KIPAS ANGIN, ANTENA,
|
2
|
2014.003.406
|
TV, RICE
COOKER, ANTENA, MESIN CUCI
|
3
|
2014.004.407
|
TV, DVD,
MESIN CUCI, KULKAS
|
4
|
2014.005.408
|
SPEAKER,
KIPAS ANGIN, MESIN CUCI, KULKAS , AC
|
5
|
2014.006.409
|
TV, SPEAKER,
KIPAS ANGIN, ANTENA,DVD
|
6
|
2014.007.410
|
TV, DVD, SPEAKER, WATER DISPENCER, AC
|
7
|
2014.008.411
|
TV, AC,
ANTENA, MESIN CUCI
|
8
|
2014.009.412
|
TV, ANTENA,
MIXER KUE, DVD, KULKAS
|
9
|
2014.010.413
|
TV, DVD,
SPEAKER, RICE COOKER, MIXER KUE, WATER DISPENCER
|
10
|
2014.011.414
|
TV, ANTENA,
RICE COOKER, KIPAS ANGIN, MESIN CUCI, DVD
|
11
|
2014.012.415
|
MIXER KUE,
RICE COOKER, WATER DISPENCER, TV, DVD
|
12
|
2014.013.416
|
MIXER KUE,
KULKAS, MESIN CUCI, KIPAS ANGIN, AC, SPEAKER, ANTENA
|
4.3
Pembahasan
Algoritma
apriori bertujuan untuk menemukan
semua aturan apriori yang memenuhi
syarat minimum support (nilai
Penunjang), yaitu kombinasi tiap item dalam database.
Dan syarat minimum confidence (nilai kepastian), yaitu kuatnya hubungan antar item dalam aturan asosiasi.
4.3.1 Penerapan
Algoritama Apriori
Dalam
menganalisa kebutuhan dengan mengunakan algoritma apriori dapat diketahui pola frekwensi tinggi jenis barang yang
paling sering dilakukan transaksi penjualan yang paling banyak atau paling
sering dibeli oleh konsumen.
1.
Pembuatan
Format Tabular
Format tabular data
transaksi bulanan, bila dibentuk akan tampak seperti tabel berikut ini:
4.2
Format Data Tabular item Data Transaksi
No
|
Nama item
|
Transaksi/Bulan
|
|||||||||||
1
|
2
|
3
|
4
|
5
|
6
|
7
|
8
|
9
|
10
|
11
|
12
|
||
1
|
TV
|
1
|
1
|
1
|
0
|
1
|
1
|
1
|
1
|
1
|
1
|
1
|
0
|
2
|
SPEAKER
|
1
|
0
|
0
|
1
|
1
|
1
|
0
|
0
|
1
|
0
|
0
|
1
|
3
|
DVD
|
1
|
0
|
1
|
0
|
1
|
1
|
0
|
1
|
1
|
1
|
1
|
0
|
4
|
KULKAS
|
1
|
0
|
1
|
1
|
0
|
0
|
0
|
1
|
0
|
0
|
0
|
1
|
5
|
ANTENA
|
1
|
1
|
0
|
0
|
1
|
0
|
1
|
1
|
0
|
1
|
0
|
1
|
6
|
KIPAS ANGIN
|
1
|
0
|
0
|
1
|
1
|
0
|
0
|
0
|
0
|
1
|
0
|
1
|
7
|
AC
|
0
|
0
|
0
|
1
|
0
|
1
|
1
|
0
|
0
|
0
|
0
|
1
|
8
|
WATER DISPENSER
|
0
|
0
|
0
|
0
|
0
|
1
|
0
|
0
|
1
|
0
|
1
|
0
|
9
|
SETRIKA
|
0
|
0
|
0
|
0
|
0
|
0
|
0
|
0
|
0
|
0
|
0
|
0
|
10
|
MESIN CUCI
|
0
|
1
|
1
|
1
|
0
|
0
|
1
|
0
|
0
|
1
|
0
|
1
|
11
|
RADIO TAPE
|
0
|
0
|
0
|
0
|
0
|
0
|
0
|
0
|
0
|
0
|
0
|
0
|
12
|
HAIR DRYER
|
0
|
0
|
0
|
0
|
0
|
0
|
0
|
0
|
0
|
0
|
0
|
0
|
13
|
MIXER KUE
|
0
|
0
|
0
|
0
|
0
|
0
|
0
|
1
|
1
|
0
|
1
|
1
|
14
|
RICE COOKER
|
0
|
1
|
0
|
0
|
0
|
0
|
0
|
0
|
1
|
1
|
1
|
0
|
4.3.2 Pola frakwensi Tinggi
Sebelum
dilakukan pencarian pola dari data transaksi terlebih dulu, dicari semua nama
jenis item produk elektronik yang ada didalam transaksi seperti sekaligus
menentukan support per item jenis produk elektronik dimana
tahap ini mencari kombinasi item yang
memenuhi syarat minimum dari nilai support dalam database.
a.
Pembentukan
Itemset
Berikut
ini adalah penyelesaian dengan contoh
kasus berdasarkan data yang sudah disediakan.
Proses
pembentukan C1 atau disebut dengan 1 itemset dengan jumlah minimum
support = 50%
Dengan
rumus sebagai berikut:
Tabel 4.3 Tabel
Kandidat item pertama
No
|
Item
|
Support
|
Support
%
|
1.
|
TV
|
10
|
83,33 %
|
2.
|
SPEAKER
|
6
|
50,00%
|
3.
|
DVD
|
8
|
66,67 %
|
4.
|
KULKAS
|
5
|
41,67 %
|
5.
|
ANTENA
|
7
|
58,33 %
|
6.
|
KIPAS ANGIN
|
5
|
41,67 %
|
7.
|
AC
|
4
|
33,33 %
|
8.
|
WATER DISPENSER
|
3
|
25,00 %
|
9.
|
SETRIKA
|
0
|
00,00%
|
10.
|
MESIN CUCI
|
6
|
50,00 %
|
11.
|
RADIO TAPE
|
0
|
00,00%
|
12.
|
HAIR DRYER
|
0
|
00,00%
|
13.
|
MIXER KUE
|
4
|
33,33 %
|
14.
|
RICE COOKER
|
4
|
33,33 %
|
Data
diatas menggambarkan bentuk data satu item, yang terdiri atas attribute item sebagai nama item jenis semua produk elektronik yang ada didalam transaksi, support yaitu jumlah setiap item yang ada disemua transaksi,
sedangkan support (%)
adalah presentasi jumlah item yang
ada didalam transkasi, yang didapat dari jumlah item dibagi jumlah semua transaksi di
kali seratus persen. Tabel diatas adalah item data yang memenuhi support minimal, nilai support minimal sama dengan 50 persen (%).
Tabel 4.4 : Daftar
Kandidat Items Kandidat Awal
No
|
Item
|
Support
%
|
1.
|
TV
|
83,33 %
|
2.
|
SPEAKER
|
50,00%
|
3.
|
DVD
|
66,67 %
|
4.
|
KULKAS
|
41,67 %
|
5.
|
ANTENA
|
58,33 %
|
6.
|
KIPAS ANGIN
|
41,67 %
|
7.
|
AC
|
33,33 %
|
8.
|
WATER DISPENSER
|
25,00 %
|
9.
|
SETRIKA
|
00,00%
|
10.
|
MESIN CUCI
|
50,00 %
|
11.
|
RADIO TAPE
|
00,00%
|
12.
|
HAIR DRYER
|
00,00%
|
13.
|
MIXER KUE
|
33,33 %
|
14.
|
RICE COOKER
|
33,33 %
|
Support = 50%
Dan kemudian bandingakan dengan support minimal.
Table 4.5 Daftar Yang Memenuhi Support minimal
No
|
Items
|
Support
|
Support(%)
|
1.
|
TV
|
10
|
83,33 %
|
2.
|
SPEAKER
|
6
|
50,00%
|
3.
|
DVD
|
8
|
66,67 %
|
4.
|
ANTENA
|
7
|
58,33 %
|
5.
|
MESIN CUCI
|
6
|
50,00 %
|
4.3.3 pembentukan
pola kombinasi dua itemset
Pembentukan pola
frekuensi dua itemset, dibentuk items-items jeneis bed cover yang
memenuhi support minimal yaitu dengan cara mengombinasikan semua item
kedalam pola dua kombinasi dua itemsets yang dibentuk, terlihat pada
tabel 4.6.
Table 4.6 pola kombinasi dua itemset
yang memenuhi support minimal
No
|
Items
|
Support
|
Support %
|
1
|
TV, SPEAKER
|
4
|
33,33%
|
2
|
TV, DVD
|
8
|
66,67%
|
3
|
TV, ANTENA
|
6
|
50,00%
|
4
|
TV, MESIN CUCI
|
4
|
33,33%
|
5
|
SPEAKER, DVD
|
4
|
33,33%
|
6
|
SPEAKER, ANTENA
|
3
|
25,00%
|
7
|
SPEAKER, MESIN CUCI
|
2
|
16,67%
|
8
|
DVD, ANTENA
|
4
|
33,33%
|
9
|
DVD, MESIN CUCI
|
2
|
16,67%
|
10
|
ANTENA, MESIN CUCI
|
3
|
25,00%
|
Support
Minimal= 50%
Kemudian bandingakan dengan suport minimum dibawah
ini.
Tabel
4.9 Daftar Items Yang Mencapai Support Minimal
Itemset
|
Support
|
Support %
|
TV, DVD
|
8
|
66,67%
|
TV, ANTENA
|
6
|
50,00%
|
Data diatas
adalah pola kombinasi dua itemset
yang memenuhi support minimal,
terlihat data kombinasi jenis elektronik TV, DVD dan TV, ANTENA
memiliki support terbanyak, itu
menandakan bahwa kombinasi dua itemsets
paling banyak dalam transaksi.
4.4 Pembentukan Pola Kombinasi TigaItemsets
Kandidat kombinasi 3 itemset diambil dari kandidat dua itemset yang mencapai atau melebihi support minimal.
Tabel
4.11 Pola Kombinasi Tiga Itemset Yang
Tidak Memenuhi Support Minimal
No
|
Items
|
Support
|
Support %
|
1
|
TV, DVD, ANTENA
|
4
|
33,33%
|
Proses
perhitungan support kombinasi 3 itemset,
tidak adanya ditemukan support yang
mencapai support minimum 50% maka proses perhitungan item berhenti, maka 2 kombinasi
yang memenuhi untuk pembentukan asosiasi.
Tabel
4.12 Daftar Items Yang Memenuhi Untuk
Pembentukan Asosiasi.
Itemset
|
Support
|
Support %
|
TV, DVD
|
8
|
66,67%
|
TV, ANTENA
|
6
|
50,00%
|
4.5 Pembentukan Aturan Assosiation Rules
Setelah
semua pola frekuensi tinggi ditemukan, barulah dicari aturan asosiasi yang
memenuhi syarat minimum untuk confidence dengan menghitung confidence aturan
asosiatif A→B.
Minimal Confidence=75%
Nilai Confidence dari aturan A→B
diperoleh dengan rumus berikut:
∑ Transaksi mengandung A dan B
Confidence = P (B\A) =
∑ Transaksi mengandung A
Dari
kombinasi 2 itemset yang telah ditemukan, dapat dilihat besarnya nilai support,
dan confidence dari calon aturan asosiasi seperti tampak pada tabel dibawah
ini:
Tabel 4.13 Aturan Asosiasi
Aturan
|
Confidence
|
|
Jika Membeli
TV : Maka Akan Membeli DVD
|
8/10
|
80,00%
|
Jika Membeli
TV : Maka Akan Membeli ANTENA
|
6/10
|
60,00%
|
Tabel 4.14 Daftar Aturan Assosiation
Rules yang Memenuhi Confidence
Minimal
Rules
|
Support (A ∩ B)
|
Support (A)
|
Confidence (%)
|
Jika Membeli
TV : Maka Akan Membeli Membeli DVD
|
8
|
10
|
80,00%
|
Association rules dari tabel
diatas merupakan aturan yang terbentuk dari pola kombinasi dua item,
tabel diatas terbagi atas beberapa bagian rules adalah aturan yang
dihasilkan dari pola kombinasi dua itemsets.
support adalah nilai support antara kedua items, sedangkan
confidence adalah nilai yang didapat dari support dua itemsets
dibagi oleh nilai support antecedent di kalikan seratus persen.
Pembentukan aturan asosiasi
berikutnya dibentuk dari pola kombinasi dua itemsets tampak pada tabel berikut ini:
Tabel 4.15 Assosiation
Rules Yang Memenuhi Nilai Confidence Minimal
Rules
|
Support
|
Confidance %
|
Jika Membeli TV :
Maka Akan Membeli DVD
|
8
|
80,00%
|
Data berikut
merupakan tabel calon association rules dari pola kombinasi dengan dua itemset.
Proses iterasi berhenti dikarnakan tidak adanya support yang minimum
mencapai 50 persen (%), confidence
sama dengan 65 persen (%), maka rule yang terbentuk adalah berasal dari
dua itemset maka pola yang dihasilkan adalah Dari rules yang
dihasilkan dari pengujian diatas yang paling tinggi nilai support dan confidence
nya adalah if (Jika dibeli TV maka akan dibeli DVD) dimana
support 50 % dan confidence 65%. Berhubung karena proses kombinasi dua items,
maka pengujian dengan parameter
maksimal card itemset sama dengan seterusnya tidak dapat dilakukan lagi,
jadi rules dengan mengunakan aplikasi tanagra menghasilkan pola
kombinasi itemsets dan Rules sebagai ilmu pengetahuan dan informasi
penting dari data transaksi penjualan produk elektronik sebelumnya bagi Toko
Master Elektronik Medan.
5.1 Algoritma
Secara umum
algoritma diartikan sebagai kumpulan aturan-aturan, sederetan operasi-operasi
atau langkah langkah untuk menyelesaikan suatu permasalahan. Didalam dunia
teknologi informasi yang berhubungan dengan sistem komputer, pembelajaran algoritma dilakukan dengan cara
mengolah data.
Dalam proses menentukan pola
kombinasi berdasarkan produk elektronik yang dijual sebelumnya maka terdapat beberapa algoritma yaitu :
1.
Algoritma perhitungan support
2.
Algoritma perhitungan confidence
5.1.1 Algoritma Support
Algoritma penentuan Support dapat dilihat pada Algoritma
dibawah ini yang terdiri dari input, Output dan proses:
Input : Tv ←
Item
Dvd ←
Item
Kulkas ← Item
Antena ← Item
Air Conditioner (Ac) ←
Item
Transaksi
If support ≥ 50% then min.Support terpenuhi
Else eliminasi
5.1.2
Algortima Confidence
Confidence (nilai kepastian) adalah
kuatnya hubungan antar item dalam
aturan assosiasi
Confidence = p (B|A) ∑Jumlah
Transaksi yang mengandung A ∩ B
∑Transaksi
A
Algoritma penentuan Confidence dapat dilihat pada Algoritma
dibawah ini yang terdiri dari input, Output dan proses:
Input : Tv ←
Item
Dvd ←
Item
Kulkas ← Item
Antena ← Item
Air Conditiner (AC) ←
Item
Transaksi
5.2 Implementasi Algoritma Apriori
mengunakan Tanagra
Dalam Mengimplementasi algoritma
apriori mengunakan tools tanagra
versi 1.4 ada beberapa langkah , berikut langkah-langkah yang harus dilakaukan
:
1.
Tentukan nilai support dan confidence
Gambar 5.1 : Association Rule
Parameter Support-Confidence Tanagra
Ganti nilai min support menjadi 0,50 dan ganti nilai confidence menjadi 0,70 untuk mencari
hasil assosiasi final, kemudian klik “ok”.
2.
Kemudian klik “ok”
Gambar 5.2 : Menu Apriori Execute Tanagra
Executive dipilih untuk mengeksekusi atau memproses assosioasi final yang memenuhi min. Support dan confidence.
3.
Klik “View”
Gambar 5.3 : Menu Apriori view tanagra
Letakan kursor pada a apriori, kemudian klik kanan
lalu pilih “view” untuk melihat hasil
asosiasi final yang memenuhi min. Support dan confidence .
4.
Maka akan muncul tampilan berikut
Gambar 5.4 : Tanagra
6.1 Kesimpulan
Berdasarkan penelitian yang
telah dilakukan, maka penulis mengambil kesimpulan bahwa :
1. Data penjualan pada toko master
elektronik selama ini tidak tersusun dengan baik, sehingga data tersebut hanya
berfungsi sebagai arsip bagi perusahaan dan tidak dapat dimanfaatkan untuk
pengembangan strategi pemasaran. Dalam penjualan produk elektronik pada toko
Master ini diperlukan data mining
untuk menentukan pola kombinasi produk elektronik. Teknik
data mining dengan mengunakan algoritma apriori dapat diimplementasikan pada sistem persediaan dengan data yang
digunakan adalah data penjualan produk elektronik sebelumnya. Data mining dengan algoritma apriori memiliki kelemahan karena harus
melakukan scan database setiap
kali iterasi, sehingga waktu bertambah setiap kali iterasi.
2. Banyaknya asosiasi antar data dan pola kombinasi
dan rules yang makin akurat, didapat berdasarkan volume data dan level confidence dan support yang
bervariasi.
3.
Software atau tools
tanagra 1.4 dalam data mining dapat memprediksi permintaan customer dalam penjualan kulkas
pertahun berikutnya berdasarkan data
transaksi tahunan sebelumnya, proses pengambilan keputusan itu
sendiri membutuhkan informasi yang akurat. Maka dalam penelitian ini penulis
meminta data di perusahaan kemudian diproses mengunakan Software Tanagra dan data tersebut secara terkomputerisasi
dapat lebih baik, sehingga diperoleh
informasi yang strategik.
6.2 Saran
Untuk kepentingan lebih lanjut dari penulisan skripsi ini maka penulis
memberikan beberapa saran sebagai berikut :
1. Disarankan dapat
dikembangkan dengan menambah volume
data serta penggunaan level confidence dan support yang
bervariasi sehingga diperoleh lebih banyak asosiasi antar data.
2.
Berdasarkan kelememahan
data mining dengan algoritma apriori
yaitu membutuhkan waktu yang lama, dan masih perlu perbandingan maka perlu
menggunakan algoritma FP ( frequent itemset). Dan masih perlu
perbandingan dengan algoritma lain, untuk menguji serta mendapatkan kesimpulan
bahwa metode algoritma apriori
berkinerja baik untuk memproses dan menemukan pola hubungan (asosiasi) antar item
dari suatu basis data data transaksi.
3. Tanagra tidak memasukan apa
yang membuat kekuatan yang dimiliki software komersil dalam area ini, seperti
sumber data yang luas, akses langsung ke data wirehouse dan data base. Masih
perlu adanya perbandingan dengan software lain untuk menguji serta mendapatkan
kesimpulan bahwa software tanagra yang
digunakan berinerja baik untuk memproses dan menemukan hasil yang
lebih baik.
DAFTAR PUSTAKA
1.
Buulolo,
Efori “Association Rules”, Dikutip Dalam Jurnal Implementasi Persediaan Obat,
2010
2.
Hermawan, Fajar. “Data mining”, Graha
Ilmu.
3.
http://webmuhammadiyah.wikipedia.com/2014/08/9/
4. http://www.wikipedia.org/wiki//2014/08/12/seprai
5.
http://kuliah.dinus.ac.id/edi-nur/sb1-7.html
6.
http//dataflowdiagram.com/flow.html.
diakses pada tanggal 27 April 2014
7.
http//dataflowdiagram.com/flow.html.
diakses pada tanggal 25 April 2014
8.
http://id.wikipedia.org/wiki/Microsoft_Excel. diakses
Tanggal 10-Mei-2014
9.
http://sartika.com. diakses Tanggal 15-Mei-2014
10. http//dataflowdiagram.com/flow.html. diakses pada
tanggal 27 April 2014
This comment has been removed by the author.
ReplyDeleteSip
ReplyDeletengitung support yg di table 4.6 gimana caranya bro? masih ga ngerti nih,makasih ya
ReplyDeleteLuckyClub Lucky Club Casino Site, Offers, Tips & Games
ReplyDeleteLucky Club is one of the most amazing online casinos in the 카지노사이트luckclub world. Enjoy exciting casino games and get new players bonus codes daily.
Lucky Clover Casino & Hotel - MapyRO
ReplyDeleteFind addresses, telephone numbers, hours, driving 구미 출장마사지 directions 광양 출장마사지 and 수원 출장마사지 a map of Lucky Clover 당진 출장샵 Casino & Hotel in Hanover, WA. 777 Casino Way Hanover, 포천 출장안마 WA 98248.