Data
Mining merupakan teknologi yang sangat berguna untuk membantu
perusahaan-perusahaan menemukan informasi yang sangat penting dari gudang data
(Data warehouse) suatu swalayan. Dengan data mining dapat meramalkan tren dan
sifat-sifat perilaku bisnis yang sangat berguna untuk mendukung pengambilan
keputusan penting. Analisis yang diotomatisasi yang dilakukan oleh data mining
melebihi yang dilakukan oleh sistem pendukung keputusan tradisional yang sudah
banyak digunakan. Data Mining dapat menjawab pertanyaan-pertanyaan bisnis yang
dengan cara tradisional memerlukan banyak waktu dan cost tinggi.
Secara
umum, data mining dapat melakukan dua hal yaitu memberikan kesempatan untuk
menemukan informasi menarik yang tidak terduga, dan juga bisa menangani data
berskala besar. Dalam menemukan informasi yang menarik ini, ciri khas data
mining adalah kemampuan pencarian secara hampir otomatis, karena dalam banyak
teknik data mining ada beberapa parameter yang masih harus ditentukan secara
manual atau semi manual. Data mining juga dapat memanfaatkan pengalaman atau
bahkan kesalahan di masa lalu untuk meningkatkan kualitas dari model maupun
hasil analisanya, salah satunya dengan kemampuan pembelajaran yang dimiliki
beberapa teknik data mining seperti klasifikasi. Data Mining mengeksplorasi
basis data untuk menemukan pola-pola yang tersembunyi, mencari informasi untuk
memprediksi yang mungkin saja terlupakan oleh para pelaku bisnis karena
terletak di luar ekspektasi mereka.
Jenis-jenis Data Mining:
1. Market
Basket Analysis
Himpunan
data yang dijadikan sebagai objek penelitan pada area data mining. Market basket
analysis adalah proses untuk menganalisis kebiasaan pelanggan dalam menyimpan
item-item yang akan dibeli ke dalam keranjang belanjaannya. Market basket
analysis memanfaatkan data transaksi penjualan untuk dianalisis sehingga dapat
ditemukan pola berupa item-item yang cenderung muncul bersama dalam sebuah
transaksi
2. Memory-Based
Reasoning.
Metode
klasifikasi yang digabungkan dengan penalaran berbasis memori. proses
menggunakan satu set data untuk membuat model dari prediksi atau asumsi-asumsi
yang dapat dibuat tentang objek baru yang diperkenalkan. Ada dua komponen dasar
untuk metode MBR. Yang pertama adalah kesamaan fungsi, yang mengukur bagaimana
anggota yang sama dari setiap pasangan object satu sama lain. Yang kedua adalah
fungsi kombinasi, yang digunakan untuk menggabungkan hasil dari himpunan
tetangga untuk sampai pada keputusan.
3. Cluster
Detection
Ada dua pendekatan untuk clustering.
Pendekatan pertama adalah dengan mengasumsikan bahwa sejumlah cluster sudah
tersimpan dalam data, tujuannya adalah untuk memecah data ke dalam cluster.
Pendekatan lain, disebut clustering agglomerative, dengan asumsi keberadaan
setiap jumlah yang telah ditetapkan cluster tertentu, setiap item keluar di
cluster sendiri, dan proses terjadi berulang-ulang yang berupaya untuk
menggabungkan cluster, meskipun proses komputasi sama.
4. Link
Analysis
Proses
mencari dan membangun hubungan antara object dalam kumpulan data juga
mencirikan sifat yang terkait dengan hubungan antara dua object. Link Analysis
berguna untuk aplikasi analitis yang mengandalkan teori grafik untuk mengambil
kesimpulan. Selain itu Link Analysis berguna untuk proses optimasi.
5. Rule
Induction
Ekstraksi aturan sebab-akibat dari data secara
statistic. identifikasi aturan bisnis yang tersimpan di dalam data. Metode
berhubungan dengan induksi aturan yang digunakan untuk proses penemuan. Salah
satu pendekatan untuk penemuan aturan adalah menggunakan pohon keputusan.
6. Neural
Networks
Model
prediksi non linear yang melakukan pembelajaran melalui latihan dan menyerupai
struktur jaringan nerual yang terdapat pada mahluk hidup. Mampu menurunkan
pengertian dari data yang kompleks dan tidak jelas dan dapat digunakan pula
untuk mengekstrak pola dan mendeteksi tren2 yang sangat kompleks untuk
dibicarakan baik oleh manusia maupun teknik komputer lainnya.
Contoh Kasus Data Mining
·
contoh kasus data mining yang terjadi
yaitu data transaksi disebuah supermarket dapat berjumlah ribuan dalam periode
singkat dan terus bertambah. Seringkali perusahaan hanya membiarkan data
tersebut menggunung untuk laporan transaksi, tetapi dengan data mining kita
dapat menggali informasi yang sangat
berharga dari data tersebut, misalnya asosiasi antar produk yang dapat
digunakan untuk menentukan tata letak produk, dapat juga digunakan untuk
menentukan daftar barang yang telah kadaluarsa.
·
Sebagai contoh lain kasus data mining
yaitu misalnya dalam bidang pemasaran,
sebelum sebuah perusahaan mengeluarkan suatu produk baru kepasaran, perusahaan
tersebut harus memiliki informasi tentang kecenderungan pelanggan untuk membeli
produk yang akan di keluarkan. Perkiraan (hypothesis) dapat disusun untuk
mengidentifikasikan pelanggan yang potensial dan karakteristik dari pelanggan
yang ada. Data-data tentang pembelian pelanggan sebelumnya dan data tentang keadaan
pelanggan, dapat digunakan untuk melakukan perbandingan antara pembelian dan
karakteristik pelanggan untuk menetapkan dan menguji target yang telah
diperkirakan sebelumnya. Dari keseluruhan operasi yang ada selanjutnya dapat
dilakukan penyaringan dengan cermat sehingga jumlah perkiraan (hypothesys) yang
sebelumnya banyak akan menjadi semakin berkurang sesuai dengan keadaan yang
sebenarnya.Permasalahan utama dengan model ini adalah tidak ada informasi baru
yang dapat dibuat, melainkan hanya pembuktian atau melemahkan perkiraan
(hypothesys) dengan data-data yang ada sebelumnya. Datadata yang ada pada model
ini hanya digunakan untuk membuktikan mendukung perkiraan (hypothesis) yang
telah diambil sebelumnya. Jadi model ini sepenuhnya tergantung pada kemampuan
user untuk melakukan analisa terhadap permasalahan yang ingin digali dan
diperoleh informasinya.
Kelebihan Data Mining :
a. Kemampuan
dalam mengolah data dalam jumlah yang besar.
b. Pencarian
Data secara otomatis.
c. Memungkinkan
data mining untuk diterapkan pada masalah-masalah kompleks yang ukurannya tidak
dibatasi lagi oleh otak manusia.
d. Selain
itu penelitian tentang algoritma parallel dari data mining juga membuka jalan
agar data mining dapat diterapkan pada program skala yang lebih besar lagi.
Kekurangan Data Mining
:
a. Kendala
Database ( Garbage in garbage out ).
b. Tidak
bisa melakukan analisa sendiri.
c. Data
mining juga tidak bisa menemukan pengetahuan yang bermanfaat secara instan.
Kesimpulan
Data
mining, yang hadir sebagai teknologi untuk memanfaatkan ketersediaan data
bisnis yang melimpah, telah membantu para pelaku bisnis untuk mempertahankan
dan mengembangkan bisnis mereka. Akan tetapi, agar teknologi data mining ini
dapat dimanfaatkan terus dengan baik, teknologi ini harus terus dapat “bekerja”
berdampingan dengan bidang lain di dunia teknologi informasi yang berkembang
dengan sangat cepat. Penyempurnaan di sana-sini masih terus diperlukan, karena
itu peluang riset di bidang ini masih terbuka lebar.
Saran
Data
mining adalah serangkaian proses untuk menggali nilai tambah dari suatu
kumpulan data berupa pengetahuan yang selama ini tidak diketahui secara manual,
juga diartikan sebagai analisa otomatis dari data yang berjumlah besar atau
kompleks dengan tujuan untuk menemukan pola atau kecenderungan yang penting
yang biasanya tidak disadari keberadaannya Disamping memiliki kemampuan, data
mining juga memiliki keterbatasan yang tidak bisa dilakukannya. Salah satu
tuntutan dari data mining ketika diterapkan pada data berskala besar adalah
diperlukan metodologi sistematis tidak hanya ketika melakukan analisa saja
tetapi juga ketika mempersiapkan data dan juga melakukan interpretasi dari
hasilnya sehingga dapat menjadi aksi ataupun keputusan yang bermanfaat.
Karenanya data mining seharusnya dipahami sebagai suatu proses, yang memiliki
tahapan-tahapan tertentu dan juga ada umpan balik dari setiap tahapan ke
tahapan sebelumnya. Dan satu lagi gunakan lah teknologi yang ada dengan cerdas.
Sumber
: