Friday, October 6, 2017

DATA MINING MENENTUKAN POLA PENJUALAN PRODUK ELEKTRONIK MENGGUNAKAN ALGORITMA APRIORI


DATA MINING MENENTUKAN POLA PENJUALAN PRODUK ELEKTRONIK MENGGUNAKAN ALGORITMA APRIORI (STUDI KASUS TOKO
MASTER ELEKTRONIK MEDAN)

Riki Satria
14110222

Mahasiswa Program Studi Teknik Informatika STMIK Budi Darma Medan
JL.Sisingamangaraja No.338 Sp.Limun Medan
http : //www.stmik-budidarma.ac.id// Email : rikisatria40@gmail.com

ABSTRAK
          Penjualan adalah sebuah usaha atau langkah kongkrit yang dilakukan untuk pemindahan suatu produk baik itu berupa barang atau jasa, dari produsen kepada konsumen sebagai sasaranya. Tujuan utama penjualan adalah mendatangkan keuntungan atau laba dari produk ataupun barang yang dihasilkan produsennya dengan pengolahan yang baik.
                Data mining adalah proses yang memperkerjakan satu atau lebih teknik pembelajaran komputer (machine learning) untuk menganalisis dan mengektraksi pengetahuan (knowledge) secara otomatis. Defenisi lain diantaranya adalah pembelajaran berbasis induksi (induction_based learning) adalah proses pembentukan defenisi-defenisi konsep konsep umum yang dilakukan secara mengobservasi contoh-contoh spesifik dari konsep-konsep yang akan dipelajari.
                Algoritma Apriori pada saat ini telah diimplementasikan keberbagai bidang, salah satunya adalah dibidang bisnis atau perdagangan dan bidang pendidikan, dibidang bisnis misalnya implementasi data mining algoritma apriori untuk sistem penjualan tujuanya untuk membantu para pembisnis meningkatkan penjualan produk, sedangkan dibidang pendidikan misalnya implementasi data mining untuk menemukan pola hubungkan tingkat kelulusan mahasiswa dengan data induk mahasiwa.    
Kata kunci : penjualan, data mining, algritma apriori


1.              PENDAHULUAN
1.1            Latar Belakang Masalah
            Algoritma Apriori pada saat ini telah diimplementasikan keberbagai bidang, salah satunya adalah dibidang bisnis atau perdagangan dan bidang pendidikan, dibidang bisnis misalnya implementasi data mining algoritma apriori untuk sistem penjualan tujuanya untuk membantu para pembisnis meningkatkan penjualan produk, sedangkan dibidang pendidikan misalnya implementasi data mining untuk menemukan pola hubungkan tingkat kelulusan mahasiswa dengan data induk mahasiwa. (Efori, 2013:8)
     Data penjualan pada toko master elektronik selama ini tidak tersusun dengan baik, sehingga data tersebut hanya berfungsi sebagai arsip bagi perusahaan dan tidak dapat dimanfaatkan untuk pengembangan strategi pemasaran. Dalam penjualan produk elektronik pada toko Master ini diperlukan data mining untuk menentukan pola kombinasi produk elektronik. Data mining merupakan analisis data menggunakan tools  untuk menemukan pola dan aturan dalam himpunan data. Penulis mengunakan  tools tanagra 1.4 dalam data mining untuk memprediksi permintaan customer dalam penjualan produk elektronik pertahun  berikutnya berdasarkan data transaksi tahunan sebelumnya, Proses pengambilan keputusan itu sendiri membutuhkan informasi yang akurat. Informasi tersebut didapat dengan memproses data yang tersedia Saat ini, proses analisa yang berkaitan dengan kegiatan transaksi yang dilakukan dengan kurang baik. Maka dalam penelitian ini penulis meminta data di perusahaan kemudian diproses mengunakan Software Tanagra dan data tersebut secara terkomputerisasi dapat  lebih baik, sehingga diperoleh informasi yang strategik.
Oleh karena itu dibutuhkan suatu pendekatan baru yang dapat menyediakan informasi strategik. Data mining merupakan paradigma baru yang secara spesifik mampu menyediakan informasi strategik bagi kelangsungan perusahaan, dimana informasi tersebut sangat penting untuk lingkungan hidup perusahaan. Sebagai proses analisis untuk kemajuan perusahaan.
            
1.2           Perumusan Masalah
Dari latar belakang di atas agar hasil penelitian menjadi lebih terarah dengan tujuan yang diharapkan maka ditemukan rumusan masalah, yaitu :
1.         Bagaimana menentukan pola penjualan produk elektronik dengan menggunakan data mining.
2.         Bagaimana  menerapkan  metode apriori pada data mining untuk menentukan pola penjualan produk elektronik pada perusahaan.
3.         Bagaimana menggunakan software Tanagra sebagai penguji dari data penjualan produk elektronik dengan data mining.


1.3           Batasan Masalah
Agar hasil penelitian menjadi lebih terarah dengan tujuan yang diharapkan, maka perlu adanya batasan masalah antara lain :
1.         Sistem ini hanya membahas untuk menentukan pola penjualan produk elektronik berdasarkan kriteria seperti merk dengan menggunakan data mining dengan metode Algoritma apriori.
2.         Sample data yang  digunakan adalah data  penjualan produk elektronik yang  ada  di Toko Master Elekronik ini merupakan data tahun 2014.
3.         Software yang dipergunakan adalah Tanagra 1.4 sebagai implementasi dan memanfaatkan tools tanagra pada Microsoft Excel 2007.

1.1             Tujuan dan Manfaat Penelitian

1.1.1          Tujuan Penelitian

Adapun tujuan dari penelitian yang dilakukan di perusahaan diantaranya adalah :
1.         Mengelompokan data penjualan produk elektronik  dengan mengunakan data mining perusahaan dapat memprediksi permintaan costumer terhadap pengeluaran produk elektronik.
2.         Menerapkan   apriori, dari data penjualan produk elektronik, agar pengolah data dalam perusahan dapat lebih baik dengan menggunakan metode tersebut.
3.         Mengunakan Algoritma apriori sebagai implementasi data mining untuk stok produk elektronik yang ada pada perusahaan.
1.1.2          Manfaat Penelitian
Adapun manfaat dari penelitian yang dilakukan pada perusahaan diantaranya merupakan :
1.         Membantu perusahaan dalam menentukan penjualan produk elektronik yang paling di minati konsumen
2.         Perusahaan dapat memprediksi penjualan produk elektronik pada perusahaan dengan menggunakan metode apriori  pada perusahaan.
3.         Perusahaan dapat memenuhi kebutuhan konsumen sesuai dengan penjualan produk elektronik yang paling diminati sehingga persediaan tidak akan kosong.
 2       Landasan Teori
2.1    Data Mining
         Data mining adalah proses yang memperkerjakan satu atau lebih tehnik pembelajaran komputer (machine learning) untuk menganalisis dan mengintegrasi suatu  pengetahuan secara otomatis. Defenisi lain diantaranya adalah pemebleajaran berbasis induksi (induction-based learning) proses pembentukan defenisi-defenisi konsep umum yang dilakukan dengan cara mengobservasi contoh-contoh spesifik dari konsep-konsep yang akan dipelajari knowledge Discovery in database adalah penerapan metode saintifik pada data mining dalam konteks ini data mining merupakan satu langkah dari knowledge Discovery in database. Sumber:  Fajar Astuti Hermawati  2013.
Data mining berisi pencarian tren atau pola yang diinginkan dalam database besar untuk membantu pengambilan keputusan diaktu yang akan datang. Pola-pola ini dikenali oleh perangkat tertentu yang dapat memberikan suatu analisa data yang berguna dan berwawasan yang kemudian dapat dipelajari dengan lebih teliti, yang mungkin saja mengunakan perangkat pendukung keputusan yang lainnya.
 


Gambar 3.1 : Data mining dan teknologi database
Sumber : Fajar Astuti Data mining 2013


                Dari gambar diatas terlihat bahwa teknologi data warehouse digunakan untuk melakukan olap, sedangkan data mining digunakan untuk melakukan Information Anality (dengan ditambah visualisasi tentunya). Dalam prakteknya, data mining juga mengambil data dari data warehouse.


2.2    Operasi Data Mining
                Operasi data mining menurut sifatnya dibedakan menjadi dua,yaitu bersifat prediksi (prediction driven) untuk menjawab pertanyaan apa dan sesuatu yang bersifat remang-remang atau transparan. Operasi prediksi digunakan untuk validasi hipotesis, queryring  dan pelaporan (misal : Spreadset dan pivot table ) serta analisis  multidimensi (dimensial summary). Olap (Online Anality Procesing) serta analisis statistik. Penemuan (discovery driven ) bersifat transparan untuk menjawab pertanyaan. Berikut proses dalam pengunaan data mining yang merupakan proses knowledge discovery In database seperti yang  terlihat pada gambar dibawah ini. Sumber: Fajar Astuti Hermawati,  2013.



Gambar 3.2 : Proses knowledge discovery In database
Sumber : Sumber : Fajar Astuti Data mining 2013

2.3    Langkah-Langkah Data Mining
 Ada empat tahap yang dilalui dalam Data Mining antara lain (Feen Lee & Juan Santana, 2010:37-40) :
1. Tahap pertama: Precise statement of the problem (mendefinisikan permasalahan yang ingin diketahui). Misalnya ingin mengetahui apakah seorang customer berpotensi memiliki kredit  macet, atau mengidentifikasi seorang customer apakah akan pindah ke kompetitor bisnis kita, dan lain sebagainya. Setelah menemukan pertanyaan bisnis yang perlu dijawab oleh data mining, selanjutnya tentukan tipe tugas untuk menjawab pertanyaan bisnis tersebut. Tugas dasar yang menjadi dasar algoritma data mining adalah klasifikasi, regresi, segmentasi, asosiasi dan sequence analisis.
2. Tahap kedua: Initial Exploration (Mempersiapkan data yang menjadi sumber untuk data mining termaksud data “cleaning” untuk mempelajari polanya). Setelah menemukan defenisi masalah, langkah berikutnya adalah mencari data yang mendukung defenisi masalah. Menentukan porsi data yang digunakan men-training data mining berdasarkan algoritma data mining yang telah dibuat. Setelah persiapan data selesai dilakukan, langkah berikutnya adalah memberikan sebagian data kedalam algoritma data mining.
3. Tahap ketiga: Model building and validation. Validasi apakah data mining memberikan prediksi yang akurat. Setelah training data selesai dilakukan, data mining tersebut perlu di-“uji” atau di-validasi keakuratannya terhadap data testing.
4. Tahap ke-empat: Deployment. Tahap ini memilih aplikasi yang tepat terhadap data mining untuk membuat prediksi.
2.4    Gudang Data (Data WareHouse)
        Data mining berpotensi  tinggi jika data yang tepat dikumpulkan dan disimpan dalam sebuah gudang data (data warehouse). Sebuah gudang data merupakan suatu sistem manajemen basis data relasional, yang didesain khusus untuk memenuhi kebutuhan akan sistem pengolahan transaksi. Data warehouse, secara bebas dapat didefenisikan sebagai tempat peyimpanan data terpusat yang dapat di-query  untuk manfaat bisnis. Sumber : Fajar Astuti Hermawati  2013.

2.5 Teknik Data Mining
          Beberapa teknikdan sifat data mining adalah sebagai berikut :
1.         Classification ( predictive)
2.         Clustering (descriptive)
3.       Association rule discovery (descriptive)
4.       Sequential patren discovery (descriptive)
5.       Regresion (descriptive)
6.       Devation detection (descriptive)

2.5    Klasifikasi
             Klasifikasi adalah menentukan sebuah record data baru kesalah satu dari beberapa kategori (atau klas) yang telah didefenisikan sebelumnya. Disebut juga dengan “supervised learning”  berikut  beberapa tipe klasifikasi :
1.     Penjualan langsung (Direct Marketing)
Tujuan  mengurangi costsurat menyurat dengan menentukan (Targeting) suatu konsumen yang mempuyai kesamaan dalam membeli produk telepon selular baru.
2.     Costomer Attrion/Churn
Untuk memprediksi pelanggan mana yang akan berpindah ke komputer kita.
3.     Fraund Detection
 Memprediksi kasus-kasus transaksi curang dengan mengunakan  kartu kredit.
Sumber:(Fajar Astuti Hermawati  2013,10.

2.6    Fungsi Dan Tugas Data Mining
     Data mining menganalisis data menggunakan tool untuk menemukan pola dan aturan dalam himpunan data. Perangkat lunak bertugas untuk menemukan pola dengan mengidentifikasi aturan dan fitur pada data. Tool data mining diharapkan mampu mengenal pola ini dalam data dengan input minimal dari user (Dana Sulistiyo Kusumo et al, 2003).              Data mining sering disebut knowledge discovery in database(KDD), adalah kegiatan yang meliputi pengumpulan, pemakaian data lama untuk menemukan peraturan pola atau hubungan dalam set data yng berukuran besar. Keluaran dari data miningbisa dipakai untuk memperbaiki pengambilan keputusan dimas depan. Sumber : (Budi Santoso,2007)

2.7    Kaidah Assosiasi (Association Rule)
Menditeksi kumpulan atribut yang muncul bersamaan (co-occur) dalam frekwensi yang sering ddan membentuk sejumlah kaidah dari kumpulan-kumpulan tersebut.Contoh 90% orang yang belanja disupermarket  yang membeli roti juga membeli selai, dan 60% dari semua orang yang belanja membeli keduanya. Sumber:  Fajar astuti hermawati  2013.
Jika diberikan sekumpulan record yang masing-masing terdiri dari sejumlah itemdari kumpulan yang diberikan akan menghasilkan aturan ketergantungan (Depency rules) yang memprediksi kejadian item dari suatu item berdasarkan kejadian item lainya. Berikut merupakan contoh dari beberapa kaidah Assisiation sebagai berikut :
1.     Marketing and sales promotion
   Misalkan diketahui aturan ketergantungan dimana :

{Bagels, ...} --> {Potato Chips}

Potato chips sebagai consequent dapat digunakan untuk menentukan apa yang dapat dilakukan untuk meningkatkan penjualan.
Bagels in the antecent dapat digunakan untuk melihat produk mana yang akan terkena dampak jika toko tersebut tidak lagi menjual bagels.
Bagels in antecendent and potato chips in consenquent dapat melihat produk apa yang harus dijual dengan bagles untuk menentukan penjualan potato chips.
2.     Supermarket Shelf management
Tujuan : Untuk mengali item-item yang dibeli bersama-sama oleh cukup banyak pelanggan. Memproses data point-of-sale yangdikumpulakan dengan pemindai Barcode untuk menentukan ketergantungan antar item.
Aturan klasik jika pelanggan membeli diaper dan susumaka juga akan membeli beear, sehingga sehingga jangan kaget jika akan menemukan enam beear yang ditumpuk dekat diapers.
3.     Inventory management
Tujuan : Seorang pelangan perusahaan perbaikan peralatan mengharpkan keaslian dari perbaikan  produk konsumen dan menjaga pelayanan dengan mengunakan suku cadang yang baik untuk mengurangi jumlah kunjungan untuk rumah pelanggan.
Pendekatan : memproses data peralatan dan suku cadang yang dibutuhkan pada perbaikan sebelumnya di tempat pelanggan yang berbeda dan menemukan pola-pola kejadian yang berulang.


2.7.1 Algoritma Apriori
                Algoritma apriori adalah adalah algoritma yang paling terkenal untuk menemukan pola frekuensi tinggi. algoritma apriori dibagi menjadi beberapa tahap yang disebut narasi atau pass. Sumber: (Efori bulolo,  2010,10.)
  1.       Pembentukan kandidat itemset, kandidat k-itemset dibentuk dari kombinasi (k-1)-itemset yang didapat dari iterasi sebelumnya. Satu cara dari algoritma apriori adalah adanya pemangkasan kandidat k-itemset yang subset-nya yang berisi k-1 item tidak termasuk dalam pola frekuensi tinggi dengan panjang k-1.
  2.     Penghitungan support dari tiap kandidat k-itemset. Support dari tiap kandidat k-itemset didapat dengan menscan database untuk menghitung jumlah transaksi yang memuat semua item didalam kandidat k-itemset tersebut. Ini adalah juga ciri dari algoritma apriori dimana diperlukan penghitungan dengan cara seluruh database sebanyak k-itemset terpanjang.
  3.     Tetapkan pola frekuensi tinggi. Pola frekuensi tinggi yang memuat k item atau k-itemset ditetapkan dari kandidat k-itemset yang supportnya lebih besar dari minimum support.
4.  Bila tidak didapat pola frekuensi tinggi baru maka seluruh proses dihentikan. Bila tidak, maka k ditambah satu dan kembali bagian 1.

2.7.2  Association Rule
  Analisis asosiasi atau association rule mining adalah teknik data mining untuk menemukan aturan assosiatif antara kombinasi item. Contoh dari aturan assosiatif dari analisa pembelian di suatu pasar swalayan adalah dapat diketahui berapa besar kemungkinan seseorang membeli roti bersamaan dengan susu. Dengan pengetahuan tersebut pemilik pasar swalayan dapat mengatur penempatan barangnya atau merancang kampanye pemasaran dengan memakai kupon diskon untuk kombinasi barang tertentu. Sumber : Efori Buulolo Association Rules Hal 4


2.5.3 Tahapan Association Rules
Analisis asosiasi dikenal juga sebagai salah satu teknik data mining yang menjadi dasar dari berbagai teknik data mining lainya. Khususnya salah satu tahap dari analisis asosiasi yang disebut analisis pola frekuensi tinggi (frequent pattern mining) menarik perhatian banyak peneliti untuk menghasilkan algoritma yang efesien Sumber : Efori Buulolo Association Rules Hal 4
Metodologi dasar analisis asosiasi terbagi menjadi dua tahap :
1. Analisa pola frekuensi tinggi
Tahap ini mencari kombinasi item yang memenuhi syarat minimum dari nilai support dalam database. Nilai support sebuah item diperoleh dengan rumus berikut:
Support (A) = Transaksi mengandungandungA&B
                                   TotaltransaksiMengadungA

Sedangkan nilai dari support 2 item diperoleh dari rumus berikut :

Support (A,B) = P(AB) =jumlahTTransndungAdanB
                                                                   Totaltransaksi n
2.  Pembentukan aturan assosiatif
Setelah semua pola frekuensi tinggi ditemukan, barulah dicari aturan assosiatif yang memenuhi syarat minimum untuk confidence dengan menghitung confidence aturan assosiatif A Nilai confidence dari aturan A diperoleh dari rumus berikut :
Confidence = P(B|A) = Jumlah transaksi mengandung AdanB
                                                       Jumlah transaksi mengandung A

2.5.4   Langkah-Langkah  Proses Perhitungan Association Rules
Proses perhitungan association rule terdiri dari beberapa tahap adalah sebagai berikut Sumber : Efori Buulolo Association Rules Hal 5

1.     Sistem men-scan database untuk mendapat kandidat 1-itemset (himpunan item yang terdiri dari 1 item) dan menghitung nilai supportnya. Kemudian nilai supportnya tersebut dibandingkan dengan minimum support yang telah ditentukan, jika nilainya lebih besar atau sama dengan minimum support maka itemset tersebut termasuk dalam large itemset.
2.     Itemset yang tidak termasuk dalam large itemset tidak diikutkan dalam iterasi selanjutnya (di prune).
3.     Pada iterasi kedua sistem akan menggunakan hasil large itemset pada iterasi pertama (L1) untuk membentuk kandidat itemset kedua (L2). Pada iterasi selanjutnya sistem akan menggunakan hasil large itemset pada iterasi selanjutnya akan menggunakan hasil large itemset pada iterasi sebelumnya (Lk-1) untuk membentuk kandidat itemset berikut (Lk). Sistem akan menggabungkan (join) Lk-1 dengan Lk-1 untuk mendapatkan Lk, seperti pada iterasi sebelumnya sistem akan menghapus (prune) kombinasi itemset yang tidak termasuk dalam large itemset.
4.     Setelah dilakukan operasi join, maka pasangan itemset baru hasil proses join tersebut dihitung supportnya.
5.     Proses pembentuk kandidat yang terdiri dari proses join dan prune akan terus dilakukan hingga himpunan kandidat itemsetnya null, atau sudah tidak ada lagi kandidat yang akan dibentuk.
6.     setelah itu, dari hasil frequent itemset tersebut dibentuk association rule yang memenuhi nilai support dan confidence yang telah ditentukan.
7.     Pada pembentukan association rule, nilai yang sama dianggap sebagai satu nilai.
8.     Assosiotion rule yang terbentuk harus memenuhi nilai minimum yang telah ditentukan.
Untuk setiap large itemset L, kita cari himpunan bagian L yang tidak kosong. Untuk setiap himpunan bagian tersebut, dihasilkan rule dengan bentuk aB(L-a) jika supportnya (L) dan supportnya (a) lebih besar dari minimum support.

2.5.5      Produk Elektronik
Produk adalah segala sesuatu yang di tawarkan kepasar untuk mendapatkan perhatian, dibeli, dipergunakan dan yang dapat memuaskan keinginan atau kebutuhan konsumen. Elektronik adalah alat yang dibuat berdasarkan prinsip elektronika serta hal atau benda yang menggunakan alat tersebut.Antara lain dapat digunakan padaElektronik Konsumen. Elektronik Konsumen adalah alat elektronik yang di tujukan untuk penggunaan sehari-hari dan dapat di gunakan untuk hiburan, komunikasi, serta bisnis.Media Elektronik merupakan sarana media masa yang mempergunakan alat elektronik modern, misal radio, televisi dan lain-lain. (https://id.m.wikipedia.org/wiki/Elektronik).

3. Analisa
     Selama ini untuk menentukan pola data penjualan produk elektronik  tidak dikelola secara terkomputerisasi yang baik dan benar. Perusahaan sulit untuk melakukan proses analisa penjualan produk elektronik. Berikut merupakan pembahasan dan analisa data penjualan produk elektronik di toko Master Elektronik Medan. Berikut dilakukan proses analisanya.

3.1. Analisis Data
         Dengan studi kasus pada Toko Master Elektronik Medan dapat dilakukan analisa prediksi terhadap data khusus data penjualan (data produk elektronik keluar) dengan salah satu tujuanya adalah untuk menemukan pola kombinasi penjualan produk elektronik dan hubungan antar item jenis produk elektronik dalam transaksi. Berikut ini adalah tabel 4.1 beberapa sampel data yang akan dijadikan sampel untuk analisis dan juga untuk pengujian.
   Data penjualan produk elektronik pada Toko Master Elektronik Medan selama 1 tahun, dimulai pada bulan Januari 2014, sampai pada bulan Desember 2014. Berikut ini merupakan data penjualan elektronik pada Toko Master Elektronik Medan :
 


           Tabel 4.1 Data Transaksi Penjualan Produk Elektronik
No
No. Slip
Nama Item
1
2014.002.404
TV, KULKAS, DVD, SPEAKER, KIPAS ANGIN,  ANTENA,
 2
2014.003.406
TV, RICE COOKER, ANTENA, MESIN CUCI
3
2014.004.407
TV, DVD, MESIN CUCI, KULKAS
4
2014.005.408
SPEAKER, KIPAS ANGIN, MESIN CUCI, KULKAS , AC
5
2014.006.409
TV, SPEAKER, KIPAS ANGIN, ANTENA,DVD
6
2014.007.410
TV, DVD, SPEAKER, WATER DISPENCER, AC
 7
2014.008.411
TV, AC, ANTENA, MESIN CUCI
8
2014.009.412
TV, ANTENA, MIXER KUE, DVD, KULKAS
9
2014.010.413
TV, DVD, SPEAKER, RICE COOKER, MIXER KUE, WATER DISPENCER
10
2014.011.414
TV, ANTENA, RICE COOKER, KIPAS ANGIN, MESIN CUCI, DVD
 11
2014.012.415
MIXER KUE, RICE COOKER, WATER DISPENCER, TV, DVD
12
2014.013.416
MIXER KUE, KULKAS, MESIN CUCI, KIPAS ANGIN, AC, SPEAKER, ANTENA




4.3  Pembahasan

Algoritma apriori bertujuan untuk menemukan semua aturan apriori yang memenuhi syarat minimum support (nilai Penunjang), yaitu kombinasi tiap item dalam database. Dan  syarat minimum confidence (nilai kepastian), yaitu kuatnya hubungan antar item dalam aturan asosiasi.

4.3.1 Penerapan Algoritama Apriori
Dalam menganalisa kebutuhan dengan mengunakan algoritma apriori dapat diketahui pola frekwensi tinggi jenis barang yang paling sering dilakukan transaksi penjualan yang paling banyak atau paling sering dibeli oleh konsumen.
1.              Pembuatan Format Tabular
Format tabular data transaksi bulanan, bila dibentuk akan tampak seperti tabel berikut ini:


4.2 Format  Data Tabular item Data Transaksi
No
Nama  item
Transaksi/Bulan
1
2
3
4
5
6
7
8
9
10
11
12
1
TV
1
1
1
0
1
1
1
1
1
1
1
0
2
SPEAKER
1
0
0
1
1
1
0
0
1
0
0
1
3
DVD
1
0
1
0
1
1
0
1
1
1
1
0
4
KULKAS
1
0
1
1
0
0
0
1
0
0
0
1
5
ANTENA
1
1
0
0
1
0
1
1
0
1
0
1
6
KIPAS ANGIN
1
0
0
1
1
0
0
0
0
1
0
1
7
AC
0
0
0
1
0
1
1
0
0
0
0
1
8
WATER DISPENSER
0
0
0
0
0
1
0
0
1
0
1
 0
9
SETRIKA
0
0
0
0
0
0
0
0
0
0
0
0
10
MESIN CUCI
0
1
1
1
0
0
1
0
0
1
0
1
11
RADIO TAPE
0
0
0
0
0
0
0
0
0
0
0
0
12
HAIR DRYER
0
0
0
0
0
0
0
0
0
0
0
0
13
MIXER KUE
0
0
0
0
0
0
0
1
1
0
1
1
14
RICE COOKER
0
1
0
0
0
0
0
0
1
1
1
0


4.3.2 Pola frakwensi Tinggi
Sebelum dilakukan pencarian pola dari data transaksi terlebih dulu, dicari semua nama jenis item produk elektronik yang ada didalam transaksi seperti sekaligus menentukan support per item jenis produk elektronik dimana tahap ini mencari kombinasi item yang memenuhi syarat minimum dari nilai support dalam database.
a.              Pembentukan Itemset
Berikut ini adalah  penyelesaian dengan contoh kasus berdasarkan data yang sudah disediakan.
Proses pembentukan C1 atau disebut dengan 1 itemset dengan jumlah minimum support = 50%
Dengan rumus sebagai berikut:
 

                                                    


Tabel 4.3 Tabel Kandidat item pertama
No
Item
Support
Support %
1.
TV
10
83,33 %
2.
SPEAKER
6
50,00%
3.
DVD
8
66,67 %
4.
KULKAS
5
41,67 %
5.
ANTENA
7
58,33 %
6.
KIPAS ANGIN
5
41,67 %
7.
AC
4
33,33 %
8.
WATER DISPENSER
3
25,00 %
9.
SETRIKA
0
00,00%
10.
MESIN CUCI
6
50,00 %
11.
RADIO TAPE
0
00,00%
12.
HAIR DRYER
0
00,00%
13.
MIXER KUE
4
33,33 %
14.
RICE COOKER
4
33,33 %

Data diatas menggambarkan bentuk data satu item, yang terdiri atas attribute item sebagai nama item jenis semua produk elektronik  yang ada didalam transaksi, support yaitu jumlah setiap item yang ada disemua transaksi, sedangkan support (%) adalah presentasi jumlah item yang ada didalam transkasi, yang didapat dari jumlah item dibagi jumlah semua transaksi di kali seratus persen. Tabel diatas adalah item data yang memenuhi support minimal, nilai support minimal sama dengan 50 persen (%).
Tabel 4.4 : Daftar Kandidat Items Kandidat Awal
No
Item
Support %
1.
TV
83,33 %
2.
SPEAKER
50,00%
3.
DVD
66,67 %
4.
KULKAS
41,67 %
5.
ANTENA
58,33 %
6.
KIPAS ANGIN
41,67 %
7.
AC
33,33 %
8.
WATER DISPENSER
25,00 %
9.
SETRIKA
00,00%
10.
MESIN CUCI
50,00 %
11.
RADIO TAPE
00,00%
12.
HAIR DRYER
00,00%
13.
MIXER KUE
33,33 %
14.
RICE COOKER
33,33 %
Support = 50%
Dan kemudian bandingakan dengan support minimal.
Table 4.5 Daftar Yang Memenuhi Support minimal
No
Items
Support
Support(%)
1.
TV
10
83,33 %
2.
SPEAKER
6
50,00%
3.
DVD
8
66,67 %
4.
ANTENA
7
58,33 %
5.
MESIN CUCI
6
50,00 %
4.3.3 pembentukan pola kombinasi dua itemset
             Pembentukan pola frekuensi dua itemset, dibentuk items-items jeneis bed cover yang memenuhi support minimal yaitu dengan cara mengombinasikan semua item kedalam pola dua kombinasi dua itemsets yang dibentuk, terlihat pada tabel 4.6.

Table 4.6 pola kombinasi dua itemset yang memenuhi support minimal
No
Items
Support
Support %
1
TV, SPEAKER
4
33,33%
2
TV, DVD
8
66,67%
3
TV, ANTENA
6
50,00%
4
TV, MESIN CUCI
4
33,33%
5
SPEAKER, DVD
4
33,33%
6
SPEAKER, ANTENA
3
25,00%
7
SPEAKER, MESIN CUCI
2
16,67%
8
DVD, ANTENA
4
33,33%
9
DVD, MESIN CUCI
2
16,67%
10
ANTENA, MESIN CUCI
3
25,00%
Support Minimal= 50%
Kemudian bandingakan dengan suport minimum dibawah ini.
                                       Tabel 4.9 Daftar Items Yang Mencapai Support Minimal
Itemset
Support
Support %
TV, DVD
8
66,67%
TV, ANTENA
6
50,00%
Data diatas adalah pola kombinasi dua itemset yang memenuhi support minimal, terlihat data kombinasi jenis elektronik TV, DVD dan TV, ANTENA memiliki support terbanyak, itu menandakan bahwa kombinasi dua itemsets paling banyak dalam transaksi.

4.4 Pembentukan Pola Kombinasi TigaItemsets
                Kandidat  kombinasi 3 itemset diambil dari kandidat dua itemset yang mencapai atau melebihi support minimal.
       Tabel 4.11 Pola Kombinasi Tiga Itemset Yang Tidak Memenuhi Support      Minimal
No
Items
Support
Support %
1
TV, DVD, ANTENA
4
33,33%
Proses perhitungan support kombinasi 3 itemset, tidak adanya ditemukan support yang mencapai support minimum 50% maka proses perhitungan item berhenti, maka 2 kombinasi yang memenuhi untuk pembentukan asosiasi.
        Tabel 4.12 Daftar Items Yang Memenuhi Untuk Pembentukan Asosiasi.
Itemset
Support
Support %
TV, DVD
8
66,67%
TV, ANTENA
6
50,00%

4.5  Pembentukan Aturan Assosiation Rules
   Setelah semua pola frekuensi tinggi ditemukan, barulah dicari aturan asosiasi yang memenuhi syarat minimum untuk confidence dengan menghitung confidence aturan asosiatif A→B.
Minimal Confidence=75%
Nilai Confidence dari aturan A→B diperoleh dengan rumus berikut:
                                                     ∑ Transaksi mengandung A dan B
Confidence = P (B\A) =
                                                          ∑ Transaksi mengandung A
Dari kombinasi 2 itemset yang telah ditemukan, dapat dilihat besarnya nilai support, dan confidence dari calon aturan asosiasi seperti tampak pada tabel dibawah ini:

Tabel 4.13 Aturan Asosiasi
Aturan
Confidence


Jika Membeli TV : Maka Akan Membeli DVD

8/10
80,00%

Jika Membeli TV : Maka Akan Membeli ANTENA

6/10
60,00%


Tabel 4.14 Daftar Aturan Assosiation Rules yang Memenuhi Confidence Minimal
Rules
Support (A B)
Support (A)
Confidence (%)
Jika Membeli TV : Maka Akan Membeli  Membeli DVD
8
10
80,00%
             Association rules dari tabel diatas merupakan aturan yang terbentuk dari pola kombinasi dua item, tabel diatas terbagi atas beberapa bagian rules adalah aturan yang dihasilkan dari pola kombinasi dua itemsets.  support adalah nilai support antara kedua items, sedangkan confidence adalah nilai yang didapat dari support dua itemsets dibagi oleh nilai support antecedent di kalikan seratus persen. Pembentukan aturan asosiasi berikutnya dibentuk dari pola kombinasi dua itemsets tampak pada tabel berikut ini:

Tabel 4.15 Assosiation Rules Yang Memenuhi  Nilai Confidence Minimal                      
Rules
Support
Confidance %
Jika Membeli TV : Maka Akan Membeli DVD
8
80,00%

   Data berikut merupakan tabel calon association rules dari pola kombinasi dengan dua itemset. Proses iterasi berhenti dikarnakan tidak adanya support yang minimum mencapai 50 persen (%),  confidence sama dengan 65 persen (%), maka rule yang terbentuk adalah berasal dari dua itemset maka pola yang dihasilkan adalah Dari rules yang dihasilkan dari pengujian diatas yang paling tinggi nilai support dan confidence nya adalah if (Jika dibeli TV maka akan dibeli DVD) dimana support 50 % dan confidence 65%. Berhubung karena proses kombinasi dua items, maka  pengujian dengan parameter maksimal card itemset sama dengan seterusnya tidak dapat dilakukan lagi, jadi rules dengan mengunakan aplikasi tanagra menghasilkan pola kombinasi itemsets dan Rules sebagai ilmu pengetahuan dan informasi penting dari data transaksi penjualan produk elektronik sebelumnya bagi Toko Master Elektronik Medan.
5.1 Algoritma
                Secara umum algoritma diartikan sebagai kumpulan aturan-aturan, sederetan operasi-operasi atau langkah langkah untuk menyelesaikan suatu permasalahan. Didalam dunia teknologi informasi yang berhubungan dengan sistem komputer,  pembelajaran algoritma dilakukan dengan cara mengolah data.
                Dalam proses menentukan pola kombinasi berdasarkan produk elektronik yang dijual sebelumnya  maka terdapat beberapa algoritma yaitu :
1.         Algoritma perhitungan support
2.         Algoritma perhitungan confidence 

5.1.1 Algoritma Support

Algoritma penentuan Support dapat dilihat pada Algoritma dibawah ini yang terdiri dari input, Output dan proses: 
Input      : Tv                                                         ← Item
                  Dvd                                                      ← Item
                  Kulkas                                                 ← Item
                  Antena                                                 ← Item
                  Air Conditioner (Ac)                          ← Item
                  Transaksi
 




   If  support ≥ 50% then min.Support terpenuhi
                                             Else eliminasi

5.1.2 Algortima Confidence                                    

                Confidence (nilai kepastian) adalah kuatnya hubungan antar item dalam aturan assosiasi
                Confidence = p (B|A) ∑Jumlah Transaksi yang mengandung A B
                                                                                ∑Transaksi A
Algoritma penentuan Confidence dapat dilihat pada Algoritma dibawah ini yang terdiri dari input, Output dan     proses:
Input      : Tv                                                         ← Item
                  Dvd                                                      ← Item
                  Kulkas                                                ← Item
                  Antena                                                 ← Item
                  Air Conditiner (AC)                           ← Item
                  Transaksi
 





5.2 Implementasi Algoritma Apriori mengunakan Tanagra
Dalam Mengimplementasi algoritma apriori mengunakan tools tanagra versi 1.4 ada beberapa langkah , berikut langkah-langkah yang harus dilakaukan :
1.             Tentukan nilai support dan confidence
                                          

Gambar 5.1 : Association Rule Parameter Support-Confidence Tanagra
                Ganti nilai min support menjadi 0,50 dan ganti nilai confidence menjadi 0,70 untuk mencari hasil assosiasi final, kemudian klik “ok”.


2.             Kemudian klik “ok”
                               

Gambar 5.2 : Menu Apriori Execute Tanagra
                Executive dipilih untuk mengeksekusi atau memproses assosioasi final yang memenuhi min. Support dan confidence.
 3.             Klik “View
                                         
                                                
Gambar 5.3 : Menu Apriori view tanagra
                Letakan kursor pada a apriori, kemudian klik kanan lalu pilih “view” untuk melihat hasil asosiasi final yang memenuhi min. Support dan confidence .

4.              Maka akan muncul tampilan berikut
                                                                                                     

Gambar 5.4 : Tanagra



6.1 Kesimpulan
                Berdasarkan penelitian yang telah dilakukan, maka penulis mengambil kesimpulan bahwa :
1.     Data penjualan pada toko master elektronik selama ini tidak tersusun dengan baik, sehingga data tersebut hanya berfungsi sebagai arsip bagi perusahaan dan tidak dapat dimanfaatkan untuk pengembangan strategi pemasaran. Dalam penjualan produk elektronik pada toko Master ini diperlukan data mining untuk menentukan pola kombinasi produk elektronik. Teknik data mining dengan mengunakan algoritma apriori dapat diimplementasikan pada sistem persediaan dengan data yang digunakan adalah data penjualan produk elektronik sebelumnya. Data mining dengan algoritma apriori memiliki kelemahan karena harus melakukan scan database setiap kali iterasi, sehingga waktu bertambah setiap kali iterasi.
2.       Banyaknya asosiasi antar data dan pola kombinasi dan rules yang makin akurat, didapat berdasarkan volume data dan level confidence dan support yang bervariasi.
3.        Software atau  tools tanagra 1.4 dalam data mining dapat memprediksi permintaan customer dalam penjualan kulkas pertahun  berikutnya berdasarkan data transaksi tahunan sebelumnya, proses pengambilan keputusan itu sendiri membutuhkan informasi yang akurat. Maka dalam penelitian ini penulis meminta data di perusahaan kemudian diproses mengunakan Software Tanagra dan data tersebut secara terkomputerisasi dapat  lebih baik, sehingga diperoleh informasi yang strategik.
6.2      Saran
          Untuk kepentingan lebih lanjut dari penulisan skripsi ini maka penulis memberikan beberapa saran sebagai berikut :
1.       Disarankan dapat dikembangkan dengan menambah volume data serta penggunaan level confidence dan support yang bervariasi sehingga diperoleh lebih banyak asosiasi antar data.
2.        Berdasarkan kelememahan data mining dengan algoritma apriori yaitu membutuhkan waktu yang lama, dan masih perlu perbandingan maka perlu menggunakan algoritma FP ( frequent itemset). Dan masih perlu perbandingan dengan algoritma lain, untuk menguji serta mendapatkan kesimpulan bahwa metode algoritma apriori berkinerja baik untuk memproses dan menemukan pola hubungan (asosiasi) antar item dari suatu basis data data transaksi.
3.     Tanagra tidak memasukan apa yang membuat kekuatan yang dimiliki software komersil dalam area ini, seperti sumber data yang luas, akses langsung ke data wirehouse dan data base. Masih perlu adanya perbandingan dengan software lain untuk menguji serta mendapatkan kesimpulan bahwa software tanagra  yang digunakan berinerja baik untuk memproses dan menemukan  hasil yang  lebih baik.


DAFTAR PUSTAKA

1.         Buulolo, Efori “Association Rules”, Dikutip Dalam Jurnal Implementasi Persediaan Obat, 2010
2.         Hermawan, Fajar. “Data mining”, Graha Ilmu.
3.         http://webmuhammadiyah.wikipedia.com/2014/08/9/
4.       http://www.wikipedia.org/wiki//2014/08/12/seprai
5.         http://kuliah.dinus.ac.id/edi-nur/sb1-7.html
6.         http//dataflowdiagram.com/flow.html. diakses pada tanggal 27 April 2014
7.         http//dataflowdiagram.com/flow.html. diakses pada tanggal 25 April 2014
8.         http://id.wikipedia.org/wiki/Microsoft_Excel. diakses Tanggal 10-Mei-2014
9.         http://sartika.com. diakses Tanggal 15-Mei-2014
10.      http//dataflowdiagram.com/flow.html. diakses pada tanggal 27 April 2014






DATA MINING MENENTUKAN POLA PENJUALAN PRODUK ELEKTRONIK MENGGUNAKAN ALGORITMA APRIORI

DATA MINING MENENTUKAN POLA PENJUALAN PRODUK ELEKTRONIK MENGGUNAKAN ALGORITMA APRIORI (STUDI KASUS TOKO MASTER ELEKTRONIK MEDAN) ...